informasi kontak saya
Surat[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Dalam perkembangan kecerdasan buatan, kemunculan model bahasa besar (LLM) menandai titik balik yang penting. Dengan terobosan teknologi pembelajaran mendalam dan peningkatan daya komputasi, LLM telah membuka gelombang baru menuju kecerdasan umum buatan (AGI) dengan skala dan kompleksitas yang belum pernah terjadi sebelumnya. Melalui pra-pelatihan dengan data yang sangat besar, model tidak hanya dapat memahami bahasa alami, tetapi juga menghasilkan teks yang koheren dan logis. Namun, terdapat masalah seperti "mengarang omong kosong", dan grafik pengetahuan telah dikembangkan selama bertahun-tahun akurasi dan efektivitas. Kombinasi keduanya dapat memecahkan masalah ilusi LLM dan membuat konten yang dihasilkan lebih akurat dan dapat diandalkan. Penulis telah memilah LLM dan grafik pengetahuan dan merangkumnya sebagai berikut untuk referensi Anda.
ChatGPT adalah model bahasa besar terlatih dialog generatif yang diluncurkan oleh OpenAI pada November 2022. Ini mewakili lompatan bagi LLM di bidang sistem dialog. ChatGPT, dengan gaya interaksi percakapannya, mampu menjawab pertanyaan lanjutan, mengakui kesalahan, menantang premis yang salah, dan menolak permintaan yang tidak pantas. Kemampuan interaktif ini memungkinkan ChatGPT mendemonstrasikan kemampuan menjawab secara rinci dan jelas di berbagai bidang pengetahuan.Namun seiring berkembangnya teknologi, ChatGPT juga mengungkap beberapa keterbatasan, sepertiMasalah akurasi dan ketepatan waktu faktual。
Untuk mengatasi masalah ini, OpenAI meluncurkan GPT-4 pada Maret 2023, yang merupakan model yang lebih lancar dan akurat serta mendukung pemahaman gambar. Peluncuran GPT-4 tidak hanya meningkatkan kemampuan pemahaman bahasa LLM, namun juga memperluas cakupan aplikasinya sehingga memungkinkannya memproses informasi multi-modal, sehingga memungkinkan tercapainya interaksi cerdas yang lebih komprehensif dan mendalam.
Model bahasa besar banyak digunakan dalam tugas pemrosesan bahasa alami (NLP), yang mencakup banyak bidang seperti klasifikasi teks, ekstraksi informasi, peringkasan teks, menjawab pertanyaan cerdas, pemahaman bacaan, terjemahan mesin, pembuatan teks, dan koreksi tata bahasa. Realisasi tugas-tugas ini memungkinkan LLM berperan dalam berbagai skenario seperti klasifikasi informasi, penataan teks, deskripsi ringkasan, dialog tanya jawab, pemahaman teks kompleks, terjemahan multi-bahasa, pembuatan konten, dan koreksi kesalahan informasi. Misalnya, dalam skenario tanya jawab yang cerdas, LLM dapat memahami pertanyaan pengguna dan memberikan jawaban yang akurat dan komprehensif; dalam tugas ringkasan teks, LLM dapat secara otomatis mengekstrak informasi penting dari teks dan menghasilkan ringkasan singkat.
Kemampuan model bahasa besar tidak dicapai dalam semalam, namun secara bertahap menjadi nyata seiring dengan bertambahnya ukuran model. “Munculnya” kemampuan ini diwujudkan dalam banyak aspek, seperti kemampuan transfer lintas domain dan kemampuan penalaran. Hanya ketika ukuran model meningkat sampai batas tertentu, kemampuan ini akan menghasilkan lompatan kualitatif. Evolusi model bahasa besar oleh Google, DeepMind, dan OpenAI telah melalui tahapan seperti pra-pelatihan, penyesuaian instruksi, dan penyelarasan.
Pada tahap pra-pelatihan, model mempelajari pola umum dan pengetahuan bahasa pada kumpulan data berskala besar. Pada fase penyempurnaan instruksi berikutnya, model mempelajari cara menyelesaikan tugas tertentu melalui instruksi tertentu. Tahap penyelarasan adalah membuat keluaran model lebih sesuai dengan harapan manusia melalui pelatihan lebih lanjut. Evolusi tahapan ini telah memungkinkan model bahasa besar menunjukkan kemampuan luar biasa dalam menangani tugas-tugas kompleks.
Selain itu, teknologi utama seperti Pembelajaran Dalam Konteks, CoT (Chain-of-Thought) Prompting, dan Penyetelan Instruksi terus-menerus mendorong batas-batas kemampuan LLM. Pembelajaran Dalam Konteks memungkinkan model mempelajari tugas baru dengan jumlah sampel yang sedikit tanpa mengubah parameter.
CoT Prompting mengajarkan model bagaimana melakukan penalaran logis dengan memberikan langkah-langkah penalaran yang terperinci.
Penyetelan instruksi menstimulasi pemahaman model dan kemampuan prediksi melalui instruksi yang jelas.
Grafik pengetahuan pada dasarnya adalah basis pengetahuan semantik yang terstruktur.Dengan merepresentasikan pengetahuan kompleks dalam bentuk grafik, mesin dapat memahami, mengambil, dan memanfaatkan pengetahuan dengan lebih baik. . Perkembangan grafik pengetahuan dapat ditelusuri kembali ke jaringan semantik pada tahun 1960an, yang terutama digunakan dalam bidang pemahaman bahasa alami. Dengan bangkitnya teknologi Internet, grafik pengetahuan mulai memainkan peran penting dalam mesin pencari, penjawab pertanyaan cerdas, dan komputasi rekomendasi.
Pada tahun 1980-an, konsep filosofis "ontologi" diperkenalkan ke dalam bidang kecerdasan buatan untuk menggambarkan pengetahuan. Selanjutnya, para peneliti di bidang representasi pengetahuan dan basis pengetahuan mengusulkan berbagai metode representasi pengetahuan, termasuk sistem kerangka kerja, aturan produksi, dan logika deskripsi. Pada tahun 1998, penemuan World Wide Web memberikan peluang baru bagi pengembangan grafik pengetahuan. Transisi dari tautan hypertext ke tautan semantik menandai kemajuan besar dalam cara pembuatan grafik pengetahuan.
Grafik pengetahuan pada dasarnya dapat dianggap sebagai model dunia, yang berasal dari bagaimana mesin merepresentasikan pengetahuan. Grafik ini menggunakan struktur grafik untuk menggambarkan hubungan antara segala sesuatu dan mencatat pengetahuan tentang berbagai hal mesin pencari, menjawab pertanyaan cerdas dan komputasi rekomendasi.
Pada tahun 2006, Tim Berners-Lee menekankan bahwa inti dari Web Semantik adalah membangun hubungan antar data terbuka. Pada tahun 2012, Google merilis produk mesin pencari berdasarkan grafik pengetahuan, yang menandai terobosan dalam penerapan komersial grafik pengetahuan. Konsep grafik pengetahuan telah berkembang sejauh ini, dari konstruksi awal oleh para ahli hingga konstruksi algoritma mesin, dan terus berkembang ke arah ekspresi pengetahuan multi-modal dan multi-bentuk.
Konstruksi grafik pengetahuan adalah proses yang kompleks, yang melibatkan beberapa langkah seperti ekstraksi pengetahuan, fusi pengetahuan, representasi pengetahuan, dan penalaran pengetahuan. Grafik pengetahuan awal sebagian besar dibuat secara manual oleh para ahli. Grafik semacam ini berkualitas tinggi, tetapi mahal dan lambat untuk diperbarui. Dengan perkembangan teknologi, algoritme pembelajaran mesin mulai digunakan untuk membuat grafik pengetahuan secara otomatis, meningkatkan efisiensi konstruksi, dan frekuensi pembaruan.
Ciri-ciri grafik pengetahuan adalah dapat merepresentasikan hubungan pengetahuan yang kompleks dalam bentuk struktur grafik, termasuk entitas, atribut, peristiwa dan hubungan. Representasi terstruktur ini tidak hanya memfasilitasi penyimpanan dan pengambilan pengetahuan, namun juga memberikan kemungkinan untuk penalaran pengetahuan. Grafik pengetahuan modern berkembang ke arah ekspresi pengetahuan multi-modal dan multi-bentuk, tidak hanya mencakup informasi teks, tetapi juga data dalam berbagai modalitas seperti gambar dan suara.
Kasus penerapan grafik pengetahuan di berbagai bidang sangat kaya dan beragam. Dalam bidang umum, grafik pengetahuan sering digunakan sebagai "pengetahuan ensiklopedia terstruktur" untuk memberikan pengetahuan akal sehat yang luas kepada pengguna biasa. Di bidang tertentu, seperti perawatan medis, hukum, keuangan, dll., grafik pengetahuan dibuat berdasarkan data industri untuk memberikan layanan pengetahuan profesional yang mendalam bagi personel industri.
Misalnya, di bidang medis, grafik pengetahuan dapat mengintegrasikan informasi tentang penyakit, obat-obatan, metode pengobatan, dll untuk membantu dokter dalam membuat diagnosis dan keputusan pengobatan. Di bidang keuangan, grafik pengetahuan dapat mewakili perusahaan, industri, pasar, dan entitas ekonomi lainnya serta keterkaitannya, membantu analis membuat keputusan investasi. Selain itu, grafik pengetahuan juga dapat digunakan dalam berbagai skenario seperti rekomendasi yang dipersonalisasi, tanya jawab cerdas, dan pembuatan konten, yang sangat memperkaya cakupan penerapan kecerdasan buatan.
Kombinasi grafik pengetahuan dan LLM memberikan kemampuan penalaran dan representasi pengetahuan yang kuat untuk sistem cerdas. Pemahaman bahasa yang kuat dan kemampuan pembangkitan LLM, dikombinasikan dengan pengetahuan terstruktur dari grafik pengetahuan, dapat mencapai penalaran pengetahuan yang lebih akurat dan mendalam. Misalnya, dalam sistem penjawab pertanyaan cerdas, LLM dapat dengan cepat menemukan pengetahuan terkait pertanyaan melalui grafik pengetahuan dan memberikan jawaban yang lebih akurat dan komprehensif.
Selain itu, grafik pengetahuan juga dapat berfungsi sebagai pelengkap LLM, memberikan pengetahuan eksternal yang diperlukan selama pelatihan model dan inferensi. Dengan memasukkan pengetahuan dalam grafik pengetahuan ke dalam LLM dalam bentuk tripel, instruksi, aturan, dll, keandalan dan interpretasi model dapat ditingkatkan. Pada saat yang sama, grafik pengetahuan juga dapat digunakan untuk mengutip, menelusuri, dan memverifikasi konten yang dihasilkan oleh LLM untuk memastikan keakuratan dan otoritas konten yang dihasilkan.
Dalam aplikasi industri, kombinasi grafik pengetahuan dan LLM juga menunjukkan potensi besar. Melalui pra-pelatihan peningkatan pengetahuan, rekayasa cepat, penalaran pengetahuan yang kompleks, dan metode lainnya, LLM untuk bidang tertentu dapat dibangun untuk memberikan layanan yang lebih profesional dan efisien. Pada saat yang sama, grafik pengetahuan juga dapat mewujudkan representasi otomatis dan pembaruan data domain, pengetahuan, dan interaksi, sehingga memungkinkan tercapainya "hiperotomatisasi".
Mempromosikan pembangunan cepat KG: ekstraksi pengetahuan/fusi pengetahuan
Pra-pelatihan peningkatan pengetahuan/Rekayasa cepat/penalaran pengetahuan kompleks/kemampuan penelusuran pengetahuan/penggabungan pengetahuan dinamis waktu nyata
• Kemampuan ekstraksi dan pembangkitan yang kuat yang ditunjukkan oleh model bahasa skala besar dapat membantu konstruksi grafik pengetahuan secara cepat dan mewujudkan ekstraksi otomatis dan fusi pengetahuan.
• Konstruksi perintah otomatis yang dibantu pengetahuan dalam grafik pengetahuan memungkinkan rekayasa perintah otomatis
• Kemampuan kemunculan LLM dan kemampuan penalaran CoT, dikombinasikan dengan kemampuan penalaran pengetahuan kompleks berdasarkan grafik pengetahuan, dapat bersama-sama menyelesaikan tugas-tugas kompleks
• Pengetahuan dalam grafik pengetahuan dapat ditambahkan ke proses pelatihan model bahasa dalam bentuk tripel, instruksi, aturan, kode, dll, untuk membantu meningkatkan keandalan dan interpretabilitas LLM
• Hubungkan hasil yang dihasilkan LLM dengan pengetahuan dalam grafik pengetahuan untuk mencapai kutipan, ketertelusuran, dan verifikasi konten yang dihasilkan
• Grafik pengetahuan menggunakan ontologi untuk merepresentasikan data domain, pengetahuan, dan interaksi, serta melengkapi otomatisasi seluruh proses mulai dari akses data, ekstraksi pengetahuan, dan pembaruan hingga tautan interaksi pengguna.
Meskipun model bahasa besar (LLM) telah menunjukkan potensi besar dalam aplikasi industri, model tersebut juga menghadapi serangkaian tantangan dan keterbatasan. Pertama, kebutuhan komputasi dan penyimpanan model besar sangat besar, yang tidak hanya meningkatkan biaya penerapan, namun juga membatasi penerapan model di lingkungan dengan sumber daya terbatas. Kedua, pelatihan dan penyesuaian model besar memerlukan data beranotasi dalam jumlah besar, dan perolehan serta pemrosesan data ini sering kali memakan waktu dan tenaga. Selain itu, kemampuan interpretasi dan pengendalian model besar relatif buruk, sehingga menimbulkan kendala dalam beberapa skenario aplikasi yang memerlukan akurasi dan transparansi tinggi.
Dalam aplikasi industri, kemampuan generalisasi model besar juga menjadi masalah. Meskipun LLM dihadapkan pada sejumlah besar data pada tahap pra-pelatihan, performa model mungkin terbatas ketika dihadapkan pada terminologi khusus industri dan logika yang kompleks. Pada saat yang sama, pembaruan dan pemeliharaan model besar juga merupakan sebuah tantangan, yang memerlukan dukungan teknis terus-menerus dan pembaruan data untuk menjaga ketepatan waktu dan keakuratan model.
Dibandingkan dengan model besar, model kecil telah menunjukkan beberapa keunggulan unik dalam penerapan industri. Model kecil lebih mudah diterapkan pada perangkat edge atau lingkungan dengan sumber daya terbatas karena ukurannya yang kecil dan biaya komputasi yang rendah. Selain itu, biaya pengembangan dan pemeliharaan model kecil yang rendah, memungkinkan usaha kecil dan menengah menggunakan teknologi pembelajaran mesin untuk meningkatkan produk dan layanan mereka.
Keuntungan lain dari model kecil adalah fleksibilitas dan penyesuaiannya. Untuk industri atau skenario aplikasi tertentu, pengembang dapat dengan cepat menyesuaikan dan mengoptimalkan model kecil untuk memenuhi kebutuhan spesifik. Misalnya, di bidang seperti konsultasi medis dan layanan hukum, model kecil dapat mempelajari terminologi dan kasus profesional dengan cara yang ditargetkan untuk memberikan layanan yang lebih akurat.
Dengan berkembangnya kerangka kerja dan alat open source, ekosistem model kecil berkembang pesat. Pengembang dapat menggunakan alat dan perpustakaan yang ada untuk dengan cepat membangun dan menerapkan model kecil guna mendorong proses intelijen industri. Pada saat yang sama, integrasi dan kombinasi model-model kecil juga memberikan ide-ide baru untuk memecahkan masalah yang kompleks. Melalui kerja kolaboratif beberapa model kecil, solusi yang lebih fleksibel dan efisien dapat dicapai.
Model bahasa multimodal semakin banyak digunakan di industri. Model tersebut dapat memproses dan memahami berbagai jenis data seperti gambar, suara, video, dll., serta memberikan pengalaman interaktif yang lebih kaya dan intuitif kepada pengguna. Di bidang e-commerce, model multimodal dapat menggabungkan gambar dan deskripsi produk untuk memberikan layanan pencarian dan rekomendasi yang lebih akurat. Di bidang pendidikan, model multimodal dapat mengidentifikasi dan menganalisis perilaku belajar siswa dan memberikan dukungan pengajaran yang dipersonalisasi.
Keuntungan dari model bahasa multimodal yang diwujudkan adalah dapat mensimulasikan persepsi dan proses kognitif manusia dengan lebih baik. Dengan mengintegrasikan informasi visual, pendengaran, dan sensorik lainnya, model dapat memahami lingkungan dan kebutuhan pengguna secara lebih komprehensif. Selain itu, model multimoda telah menunjukkan kemampuan yang kuat dalam menangani skenario dan tugas yang kompleks, seperti layanan mengemudi otonom dan robot.
Namun, pengembangan dan penerapan model multimoda juga menghadapi tantangan teknis dan sumber daya. Pengumpulan, anotasi, dan penggabungan data multimodal memerlukan pengetahuan interdisipliner dan dukungan teknis. Selain itu, model multimodal memiliki kompleksitas komputasi yang tinggi dan memerlukan algoritma yang efisien serta strategi optimasi untuk mencapai pemrosesan yang real-time dan akurat.
Untuk meningkatkan kepraktisan model bahasa besar, peningkatan pengambilan dan eksternalisasi pengetahuan telah menjadi dua cara teknis yang penting. Peningkatan pengambilan meningkatkan kemampuan pengambilan informasi model dengan memperkenalkan basis pengetahuan eksternal, membantu model memperoleh informasi yang lebih kaya dan akurat saat menjawab pertanyaan. Metode ini dapat secara efektif mengatasi kekurangan model dalam menangani masalah atau tugas jangka panjang yang memerlukan informasi terkini.
Eksternalisasi pengetahuan menyematkan pengetahuan eksternal yang dibutuhkan oleh model ke dalam model dalam bentuk parameter, sehingga model dapat langsung memanfaatkan pengetahuan tersebut selama proses penalaran dan pembangkitan. Pendekatan ini dapat meningkatkan kemampuan interpretasi dan pengendalian model, memungkinkan pengembang dan pengguna untuk lebih memahami dan mempercayai keluaran model.
Dalam aplikasi industri, peningkatan pengambilan dan eksternalisasi pengetahuan dapat diintegrasikan secara erat dengan proses bisnis dan sistem pengambilan keputusan untuk memberikan bantuan dan dukungan yang cerdas. Misalnya, dalam analisis keuangan, melalui peningkatan pengambilan, model dapat memperoleh data pasar dan berita terkini secara real-time untuk memberikan saran investasi kepada pengguna. Dalam diagnosis medis, eksternalisasi pengetahuan dapat membantu model dengan cepat menghubungi pedoman klinis dan informasi obat untuk membantu dokter dalam mengambil keputusan.
Tren perkembangan model bahasa besar (LLM) menunjukkan masa depan yang lebih cerdas dan personal. Dengan kemajuan teknologi, LLM berkembang pesat ke arah berikut:
Alat open source memainkan peran penting dalam pengembangan LLM. Mereka tidak hanya menurunkan ambang batas pengembangan, namun juga mendorong iterasi cepat dan inovasi teknologi. Misalnya, Hugging Face menyediakan serangkaian perpustakaan dan model sumber terbuka yang memungkinkan pengembang dengan mudah mengintegrasikan dan menyempurnakan LLM. Selain itu, strategi untuk meningkatkan LLM meliputi:
Menanggapi kekurangan LLM saat ini, para peneliti telah mengusulkan beberapa langkah perbaikan, seperti membuat LLM menggunakan alat eksternal untuk meningkatkan pemahaman konteks dengan informasi penting yang hilang tidak termasuk dalam bobot LLM untuk membentuk agen yang lebih kuat; secara kolektif disebut penyempurnaan Model Bahasa (ALM)
pemikiran(Penalaran): Memecah tugas-tugas kompleks menjadi sub-tugas yang lebih sederhana sehingga LM dapat menyelesaikannya dengan lebih mudah sendiri atau menggunakan alat.
alat(ToO): Mengumpulkan informasi eksternal atau memberikan dampak pada dunia virtual atau fisik yang dirasakan oleh ALM.
Perilaku(Bertindak): Gunakan alat yang berdampak pada dunia virtual atau fisik dan amati hasilnya, gabungkan ke dalam konteks ALM saat ini.
Setara dengan: Penalaran dan alat dapat ditempatkan dalam modul yang sama, baik dengan meningkatkan konteks LM untuk memprediksi hilang dengan lebih baik; alat yang mengumpulkan informasi tambahan dan alat yang berdampak pada dunia virtual atau fisik dapat digunakan oleh LM dengan cara yang sama transfer.
Seiring dengan meningkatnya kebutuhan spesifik industri, lahirnya model-model besar yang dapat disesuaikan menjadi hal yang tak terelakkan. Model-model ini akan dioptimalkan untuk industri atau tugas tertentu, seperti model penilaian risiko di bidang keuangan atau model bantuan diagnostik di bidang layanan kesehatan. Jalur implementasi meliputi:
Sistem multi-agen dan paradigma teknologi saraf + simbolik adalah arah utama untuk pengembangan di masa depan. Sistem multi-agen dapat mensimulasikan mekanisme kolaborasi dan persaingan masyarakat manusia dan menyelesaikan tugas-tugas yang lebih kompleks. Paradigma teknologi saraf + simbolik menggabungkan keunggulan pembelajaran mendalam dan penalaran simbolik untuk meningkatkan kemampuan penalaran logis dan kemampuan interpretasi model. Perkembangan teknologi ini akan mendorong kemajuan LLM dalam aspek-aspek berikut:
Paradigma pengembangan aplikasi generasi baru berdasarkan "model besar + grafik pengetahuan" mulai terbentuk. Paradigma ini mengambil grafik pengetahuan sebagai pusat data dan pengetahuan dan menggabungkannya dengan kemampuan pemrosesan bahasa alami LLM untuk mencapai pengembangan aplikasi yang lebih cerdas dan otomatis. Misalnya:
Masa depan model bahasa besar penuh dengan peluang, dan mereka akan memainkan peran penting dalam banyak aspek seperti inovasi teknologi, aplikasi industri, dan pengalaman pengguna. Alat sumber terbuka dan ide peningkatan akan mendorong pemasyarakatan dan optimalisasi LLM, model besar yang disesuaikan akan memenuhi kebutuhan industri tertentu, dan kolaborasi multi-agen serta paradigma teknologi saraf + simbolik akan mendorong pengembangan lebih lanjut dari sistem cerdas. Paradigma pengembangan aplikasi generasi baru akan memanfaatkan kemampuan LLM dan grafik pengetahuan untuk mencapai pengembangan aplikasi yang lebih cerdas dan otomatis.