-
Gambaran penelitian
- Model LIMO menghadirkan temuan yang memberi pemahaman baru tentang bagaimana kemampuan penalaran kompleks muncul dalam model bahasa skala besar.
- Berlawanan dengan anggapan sebelumnya, penalaran matematis yang kompleks dapat diinduksi secara efektif hanya dengan sedikit contoh.
- LIMO mencapai akurasi 57.1% pada AIME dan 94.8% pada MATH hanya dengan 817 sampel pelatihan.
- Ini merupakan peningkatan besar dibandingkan 6.5% dan 59.2% pada model berbasis SFT sebelumnya, sambil hanya menggunakan 1% dari data pelatihan pendekatan terdahulu.
-
Performa LIMO
- LIMO menunjukkan peningkatan performa absolut sebesar 40.5% pada 10 benchmark yang beragam, dan melampaui model yang dilatih dengan data 100 kali lebih banyak.
- Ini menantang anggapan yang ada bahwa SFT menghasilkan generalisasi alih-alih sekadar hafalan.
-
Hipotesis LIMO
- Hipotesis LIMO mengusulkan bahwa jika pengetahuan domain dalam model dasar telah sepenuhnya dikodekan selama pra-pelatihan, kemampuan penalaran kompleks dapat muncul hanya dengan demonstrasi minimal.
- Ambang untuk memunculkan penalaran kompleks ditentukan oleh dua faktor utama:
- Kelengkapan basis pengetahuan yang telah dikodekan dalam model selama pra-pelatihan.
- Efektivitas contoh pasca-pelatihan sebagai "template kognitif" yang menunjukkan cara model memanfaatkan basis pengetahuannya untuk menyelesaikan tugas penalaran kompleks.
-
Tersedia sebagai open source
- Untuk mendorong reproduktibilitas dan penelitian lanjutan tentang penalaran yang efisien dari sisi data, LIMO disediakan sebagai suite open source yang komprehensif.
Belum ada komentar.