1 poin oleh GN⁺ 2025-02-22 | Belum ada komentar. | Bagikan ke WhatsApp
  • Sky-T1

  • Melatih model O1 Preview dengan $450

    • Model seperti O1 dan Gemini 2.0 menunjukkan kemampuan penalaran yang unggul dalam menyelesaikan tugas kompleks, dan melakukannya melalui proses berpikir internal yang panjang.
    • Namun, karena detail teknis dan bobot model tidak dapat diakses, hal ini menjadi hambatan bagi partisipasi kalangan akademik dan komunitas open source.
    • Sebagai tanggapan, muncul beberapa upaya penting untuk melatih model penalaran berbobot terbuka di bidang matematika, seperti Still-2 dan Journey.
    • Tim NovaSky dari UC Berkeley sedang mengeksplorasi berbagai teknik untuk memajukan kemampuan penalaran model dasar dan model yang telah disesuaikan dengan instruksi.
    • Dalam penelitian ini, kinerja penalaran yang kompetitif tidak hanya dicapai dalam matematika, tetapi juga dalam coding, pada model yang sama.
  • Kontributor

    • Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica

Belum ada komentar.

Belum ada komentar.