LLM yang Benar-Benar Terbuka, Hello OLMo Hadir
(blog.allenai.org)-
AI2 merilis model OLMo 7B. Ini adalah model bahasa besar open source dalam arti yang sesungguhnya karena data prapelatihan dan kode pelatihannya dibuka bersama.
- Hal ini memungkinkan peneliti dan pengembang menggunakan model terbuka terbaik untuk secara kolektif memajukan sains model bahasa.
- Ilmuwan AI Meta, Yann LeCun, menyebut bahwa komunitas open source dapat membangun masa depan AI dengan cara paling cepat dan efektif.
-
Fitur utama framework OLMo:
- Data prapelatihan lengkap: menggunakan dataset Dolma dari AI2, dan juga mencakup kode untuk menghasilkan data pelatihan.
- Kode pelatihan dan bobot model: menyediakan bobot model lengkap, kode inferensi, metrik pelatihan, log pelatihan, dan lainnya untuk 4 varian model berskala 7B.
- Evaluasi: di bawah proyek Catwalk, alat evaluasi yang digunakan dalam pengembangan, termasuk lebih dari 500 checkpoint dan kode evaluasi, turut dibuka.
-
Melalui OLMo, peneliti dan pengembang AI dapat memperoleh pengalaman berikut:
- Analisis yang lebih akurat: dapat bekerja lebih cepat berdasarkan wawasan lengkap terhadap data pelatihan.
- Pengurangan emisi karbon: dengan membuka seluruh ekosistem pelatihan dan evaluasi, pengembangan yang duplikatif dapat dikurangi.
- Hasil yang berkelanjutan: dengan membuka model dan dataset, pihak lain dapat belajar dari model sebelumnya dan membangunnya lebih lanjut.
-
Pengembangan OLMo dimungkinkan melalui kolaborasi dengan AMD, CSC (Lumi Supercomputer), University of Washington, Databricks, dan lainnya.
Opini GN⁺
- Membuka data pelatihan dan kode untuk meningkatkan transparansi model AI tampak sangat bermakna. Namun, karena mungkin ada masalah seperti bias data, peninjauan terhadap hal tersebut juga tampaknya diperlukan.
- Aktivasi ekosistem model bahasa open source diperkirakan akan mempercepat perkembangan teknologi. Namun, masih perlu dilihat hasil seperti apa yang bisa dicapai dalam persaingan dengan model AI tertutup milik perusahaan IT besar.
- Untuk mengamankan sumber daya komputasi masif yang dibutuhkan dalam pengembangan AI, kolaborasi dengan berbagai institusi tampak sangat penting. Ini bisa menjadi teladan yang baik sebagai model kerja sama antara akademisi dan industri.
- Diharapkan OLMo akan mendorong penelitian ilmiah yang lebih aktif mengenai prinsip kerja model bahasa. Ini dapat mengarah pada pengembangan AI yang lebih aman dan lebih dapat dipercaya.
1 komentar
Opini Hacker News