Peneliti MIT mendemonstrasikan teknik penelusuran pengetahuan pada model bahasa besar
- Ditemukan bahwa model bahasa besar menggunakan mekanisme sederhana untuk mengambil pengetahuan yang tersimpan saat merespons prompt pengguna.
- Para peneliti menunjukkan bahwa dengan memanfaatkan mekanisme sederhana ini, kita dapat memahami apa yang diketahui model tentang berbagai topik dan memperbaiki informasi yang tersimpan secara keliru.
Kompleksitas model bahasa besar
- Model bahasa besar digunakan di berbagai bidang seperti dukungan pelanggan, pembuatan kode, dan penerjemahan bahasa, tetapi cara kerjanya masih belum sepenuhnya dipahami.
- Peneliti dari MIT dan lembaga lain mempelajari mekanisme yang digunakan model pembelajaran mesin raksasa ini untuk mengambil pengetahuan yang tersimpan.
Mekanisme sederhana untuk mengambil pengetahuan
- Hasil penelitian menunjukkan bahwa model bahasa besar sering menggunakan fungsi linear sederhana untuk memulihkan dan mendekode fakta yang tersimpan.
- Model menggunakan fungsi dekode yang sama untuk jenis fakta yang serupa.
- Fungsi linear adalah persamaan yang merepresentasikan hubungan garis lurus antara dua variabel.
Menjelajahi apa yang diketahui model
- Para peneliti mengidentifikasi fungsi linear untuk berbagai fakta guna menelusuri apa yang diketahui model tentang topik baru, serta memeriksa di mana pengetahuan itu disimpan di dalam model.
- Dengan menggunakan teknik yang dikembangkan dan fungsi-fungsi sederhana yang diperkirakan, mereka menemukan bahwa bahkan ketika model memberikan jawaban yang salah, model sering kali tetap menyimpan informasi yang benar.
Visualisasi pengetahuan model
- Para peneliti menggunakan fungsi-fungsi tersebut untuk menentukan apa yang benar-benar diyakini model sebagai kebenaran tentang topik yang berbeda.
- Sebagai contoh, mereka memulai dari prompt "Bill Bradley was a" dan menggunakan fungsi dekode untuk "plays sports" dan "attended university" guna memeriksa apakah model mengetahui bahwa Sen. Bradley adalah seorang pemain basket dan lulusan Princeton University.
- Dengan teknik penelusuran ini, mereka membuat grid yang disebut 'attribute lens' untuk memvisualisasikan di mana informasi tentang relasi tertentu disimpan di dalam berbagai lapisan transformer.
Opini GN⁺
- Riset ini membawa pemahaman tentang bagaimana model bahasa besar menyimpan dan mengambil pengetahuan faktual ke tingkat berikutnya.
- Temuan ini menunjukkan kemungkinan untuk memanfaatkan hasil riset dalam memperbaiki pengetahuan dan mencegah kesalahan pada chatbot AI guna mengurangi kecenderungan model memberikan informasi yang salah.
- Jika teknologi ini diterapkan, hal ini dapat berkontribusi pada peningkatan keandalan AI dan membantu memperbaiki pengalaman pengguna.
- Namun, karena tidak semua fakta dikodekan secara linear, diperlukan riset lanjutan untuk mengetahui apakah teknik ini dapat diterapkan pada semua jenis pengambilan pengetahuan.
- Proyek open source dengan fungsi serupa mencakup seri BERT dari Google dan seri GPT dari OpenAI, yang juga berkontribusi dalam memahami cara kerja model bahasa besar.
- Saat mengadopsi teknologi baru, perlu dipertimbangkan keseimbangan antara kompleksitas model dan keterjelasan interpretasinya, dan salah satu manfaat dari memilih teknologi ini adalah peningkatan akurasi dan keandalan model.
1 komentar
Komentar Hacker News
Pekerjaan yang mengejutkan ini menyoroti beberapa masalah terbesar di bidang AI saat ini
Struktur bahasa memungkinkan Word2Vec
Membantu memahami implikasi dari fakta yang disimpan sebagai fungsi linear
Rasa ingin tahu tentang jenis fungsi yang digunakan untuk mengenkode pengetahuan pemrograman
Menemukan kemiripan dengan apa yang dilakukan vektor relasi dalam Word2Vec
LLM tampak seperti mekanisme kompresi yang bagus
Mengingatkan pada contoh embedding "King - Man + Woman = Queen"
Sulit memahami bagaimana "file CSV/database/model" dengan 7 miliar "parameter" dapat menyediakan LLM/GPT interaktif yang berpengetahuan luas tentang hampir semua topik
Menyukai bahwa makalah ini keren dan melakukan eksperimen untuk memverifikasi ide-ide tersebut
Kemungkinan memisahkan bagian penalaran dari bagian informasi