Peran Pengetahuan Prosedural dalam Pra-pelatihan untuk Mendorong Penalaran Model Bahasa Besar
(arxiv.org)-
Dampak Pengetahuan Prosedural terhadap Penalaran Model Bahasa Besar
-
Kemampuan dan keterbatasan model bahasa besar (LLM) telah diteliti secara rinci dalam beberapa tahun terakhir. LLM menunjukkan kemampuan pemecahan masalah, tetapi dibandingkan manusia masih ada kesenjangan dalam penalaran, sehingga menimbulkan pertanyaan tentang ketangguhan strategi generalisasinya.
-
Karena besarnya jumlah data yang digunakan dalam perancangan LLM, pemisahan set latih-uji sebagai metode tradisional untuk mengukur generalisasi menjadi sulit dilakukan. Untuk mengatasi hal ini, data pra-pelatihan diteliti guna melihat strategi generalisasi yang digunakan LLM saat menjalankan tugas penalaran.
-
Dengan menggunakan model dalam dua ukuran (7B dan 35B) serta 2,5 miliar token pra-pelatihan, dokumen yang memengaruhi keluaran model diidentifikasi untuk tiga tugas penalaran matematis sederhana, lalu dibandingkan dengan data yang memengaruhi model dalam menjawab pertanyaan faktual.
-
Untuk setiap pertanyaan faktual, model terutama menggunakan set data yang berbeda-beda. Namun, pada pertanyaan penalaran yang berbeda dalam tugas yang sama, dokumen sering kali memberikan pengaruh yang serupa, yang menunjukkan adanya pengetahuan prosedural.
-
Jawaban atas pertanyaan faktual sering muncul dalam data yang paling berpengaruh, tetapi pada pertanyaan penalaran, baik jawaban maupun jawaban atas langkah-langkah penalaran antara tidak menunjukkan pengaruh yang tinggi.
-
Hasil analisis kualitatif terhadap dokumen teratas untuk pertanyaan penalaran mengonfirmasi bahwa dokumen yang berpengaruh sering kali memuat pengetahuan prosedural yang menunjukkan cara penyelesaian melalui rumus atau kode.
-
Temuan ini menunjukkan bahwa pendekatan penalaran yang digunakan model bukan sekadar pencarian sederhana, melainkan strategi yang dapat digeneralisasi dengan menyintesis pengetahuan prosedural dari dokumen yang melakukan penalaran dalam bentuk serupa.
1 komentar
Komentar Hacker News
Menunjukkan bahwa LLM tidak dapat menemukan contoh untuk semua masalah di data pelatihan, serta menyebutkan bahwa contoh pencarian faktual yang diperlukan untuk eksplorasi bergaya pengambilan informasi tidak cukup banyak
Menunjukkan bahwa manusia harus menyelesaikan masalah langkah demi langkah agar jaringan saraf dapat menirunya
Menyebutkan bahwa LLM memang menunjukkan kemampuan memecahkan masalah, tetapi ada kesenjangan penalaran jika dibandingkan dengan manusia
Menjelaskan bahwa ketika model bahasa menjawab pertanyaan penalaran, sering kali mereka mengambil informasi dari kumpulan dokumen yang terbatas
Berargumen bahwa pra-pelatihan Google memainkan peran penting dalam desain chip
Bertanya mengapa gambar yang dihasilkan terasa seperti mimpi buruk, dan berargumen bahwa dibutuhkan lebih banyak data pelatihan penalaran
Menjelaskan melalui perbandingan AlphaGo dan AlphaZero bahwa pengetahuan prosedural manusia membantu pelatihan ML, tetapi mungkin memiliki keterbatasan
Mengusulkan bahwa melatih dengan catatan siswa, ujian, ulasan buku, dan sejenisnya dapat membuat LLM menjadi lebih baik, serta menyebutkan bahwa ini akan sangat menarik