3 poin oleh GN⁺ 2025-02-10 | Belum ada komentar. | Bagikan ke WhatsApp
  • Gambaran penelitian

    • Model LIMO menghadirkan temuan yang memberi pemahaman baru tentang bagaimana kemampuan penalaran kompleks muncul dalam model bahasa skala besar.
    • Berlawanan dengan anggapan sebelumnya, penalaran matematis yang kompleks dapat diinduksi secara efektif hanya dengan sedikit contoh.
    • LIMO mencapai akurasi 57.1% pada AIME dan 94.8% pada MATH hanya dengan 817 sampel pelatihan.
    • Ini merupakan peningkatan besar dibandingkan 6.5% dan 59.2% pada model berbasis SFT sebelumnya, sambil hanya menggunakan 1% dari data pelatihan pendekatan terdahulu.
  • Performa LIMO

    • LIMO menunjukkan peningkatan performa absolut sebesar 40.5% pada 10 benchmark yang beragam, dan melampaui model yang dilatih dengan data 100 kali lebih banyak.
    • Ini menantang anggapan yang ada bahwa SFT menghasilkan generalisasi alih-alih sekadar hafalan.
  • Hipotesis LIMO

    • Hipotesis LIMO mengusulkan bahwa jika pengetahuan domain dalam model dasar telah sepenuhnya dikodekan selama pra-pelatihan, kemampuan penalaran kompleks dapat muncul hanya dengan demonstrasi minimal.
    • Ambang untuk memunculkan penalaran kompleks ditentukan oleh dua faktor utama:
      1. Kelengkapan basis pengetahuan yang telah dikodekan dalam model selama pra-pelatihan.
      2. Efektivitas contoh pasca-pelatihan sebagai "template kognitif" yang menunjukkan cara model memanfaatkan basis pengetahuannya untuk menyelesaikan tugas penalaran kompleks.
  • Tersedia sebagai open source

    • Untuk mendorong reproduktibilitas dan penelitian lanjutan tentang penalaran yang efisien dari sisi data, LIMO disediakan sebagai suite open source yang komprehensif.

Belum ada komentar.

Belum ada komentar.