-
Sky-T1
-
Melatih model O1 Preview dengan $450
- Model seperti O1 dan Gemini 2.0 menunjukkan kemampuan penalaran yang unggul dalam menyelesaikan tugas kompleks, dan melakukannya melalui proses berpikir internal yang panjang.
- Namun, karena detail teknis dan bobot model tidak dapat diakses, hal ini menjadi hambatan bagi partisipasi kalangan akademik dan komunitas open source.
- Sebagai tanggapan, muncul beberapa upaya penting untuk melatih model penalaran berbobot terbuka di bidang matematika, seperti Still-2 dan Journey.
- Tim NovaSky dari UC Berkeley sedang mengeksplorasi berbagai teknik untuk memajukan kemampuan penalaran model dasar dan model yang telah disesuaikan dengan instruksi.
- Dalam penelitian ini, kinerja penalaran yang kompetitif tidak hanya dicapai dalam matematika, tetapi juga dalam coding, pada model yang sama.
-
Kontributor
- Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica
Belum ada komentar.