Quiet-STaR: Dapat Mengajarkan Model Bahasa untuk Berpikir Sebelum Berbicara
- Manusia terkadang berhenti untuk berpikir saat menulis atau berbicara, dan penalaran semacam ini tersirat dalam hampir semua teks tertulis.
- Dalam Self-Taught Reasoner(STaR), ditunjukkan cara mempelajari pemikiran yang berguna dengan menalar dasar dalam tanya-jawab dari sejumlah kecil contoh, lalu belajar dari dasar yang menghasilkan jawaban yang benar.
- Quiet-STaR adalah generalisasi dari STaR, yang melatih model bahasa untuk menghasilkan dasar pada setiap token guna menjelaskan teks masa depan sehingga prediksi menjadi lebih baik.
Tantangan utama dan solusi
- Ada tantangan seperti biaya komputasi dari pembuatan teks berurutan, masalah bahwa model bahasa pada awalnya tidak tahu cara menghasilkan atau menggunakan pemikiran internal, serta kebutuhan untuk memprediksi melampaui token berikutnya secara individual.
- Untuk mengatasi masalah ini, diusulkan algoritma sampling paralel per token yang menggunakan token yang dapat dipelajari untuk menandai awal dan akhir pemikiran, serta teknik teacher-forcing yang diperluas.
Peningkatan kinerja model
- Dasar yang dihasilkan membantu memprediksi token-token yang sulit dan meningkatkan kemampuan model bahasa untuk menjawab langsung pertanyaan yang sulit.
- Setelah model bahasa terus dipra-latih dengan Quiet-STaR pada korpus teks internet, ditemukan peningkatan zero-shot pada GSM8K(5.9%→10.9%) dan CommonsenseQA(36.3%→47.2%), serta peningkatan perplexity pada token-token sulit dalam teks alami.
- Peningkatan ini dicapai tanpa fine-tuning untuk tugas-tugas tersebut.
Opini GN⁺
- Quiet-STaR menunjukkan satu langkah maju menuju cara yang lebih umum dan dapat diskalakan bagi model bahasa untuk mempelajari penalaran.
- Riset ini menandai kemajuan penting dalam memperkuat pemahaman bahasa dan kemampuan penalaran di bidang kecerdasan buatan, serta dapat berkontribusi pada perkembangan teknologi pemrosesan bahasa alami.
- Dari sudut pandang kritis, ketika teknologi seperti ini diterapkan pada masalah dunia nyata yang kompleks, hal itu dapat menimbulkan hasil yang tidak terduga, sehingga diperlukan riset tambahan dan langkah-langkah pengamanan.
- Proyek lain dengan fungsi serupa mencakup seri GPT dari OpenAI dan BERT dari Google, yang juga sedang diteliti untuk meningkatkan kemampuan pemahaman dan generasi bahasa.
- Hal-hal yang perlu dipertimbangkan saat mengadopsi teknologi ini mencakup kualitas dan keberagaman data pelatihan, penggunaan model yang etis, serta biaya komputasi; manfaat yang dapat diperoleh dari memilih teknologi ini adalah terciptanya model bahasa yang lebih akurat dan lebih rinci.
1 komentar
Opini Hacker News