13 poin oleh xguru 2024-04-29 | 3 komentar | Bagikan ke WhatsApp
  • Sejak model Llama 3 dirilis pada 18/4, respons komunitas pengembang sangat luar biasa
    • Model tersebut telah diunduh lebih dari 1,2 juta kali, dan para pengembang membagikan lebih dari 600 model turunan di Hugging Face
    • Repositori GitHub Llama 3 menerima lebih dari 17.000 bintang
    • Di leaderboard LMSYS Chatbot Arena, model Llama 3 70B Instruct menempati peringkat 1 dalam evaluasi khusus bahasa Inggris, dan secara keseluruhan berada di peringkat 6, menjadikannya model terbuka dengan peringkat tertinggi (setelah model tertutup/proprietary)

Contoh penerapan awal Llama 3

  • Mitra penyedia silikon, perangkat keras, dan cloud mulai menerapkan Llama 3 kepada pengguna
  • Di Yale School of Medicine, bersama EPFL School of Computer and Communication Sciences, Llama 3 di-fine-tune dalam waktu 24 jam setelah peluncurannya dan diperkenalkan sebagai Llama-3[8B]-MeditronV1.0, model Llama 3 8B pertama untuk bidang medis
    • Model baru ini melampaui semua model terbuka terbaru dengan kelas parameter yang sama pada benchmark standar seperti MedQA dan MedMCQA
    • Detail lebih lanjut tentang bagaimana Yale University dan EPFL membangun versi pertama Meditron berbasis Llama 2 dapat dilihat melalui tautan tersebut

Rencana Llama 3 ke depan

  • Dalam beberapa bulan ke depan, mereka berencana merilis model dengan fitur baru seperti multimodal, percakapan multibahasa, context window yang lebih panjang, dan peningkatan kemampuan secara keseluruhan
  • Mereka berharap dapat segera membagikan lebih banyak hal dan menyaksikan gelombang inovasi berikutnya yang dipimpin komunitas

3 komentar

 
gcback 2024-04-29

Seiring waktu, LLM dari perusahaan besar dalam negeri tampaknya makin kehilangan daya saing. Jika strateginya tertutup, setidaknya mereka harus cukup kompetitif dari sisi performa; atau jika strateginya adalah memperluas penggunaan meski performanya kalah, mereka seharusnya tidak menonjolkan fokus pada bahasa Korea—tetapi yang terjadi justru kebalikannya.

 
cosine20 2024-04-30

Di leaderboard berbahasa Korea cuma sibuk perang bobot yang nggak ada artinya, terus itu dijadiin berita buat menopang harga saham juga wkwkwk

 
[Komentar ini disembunyikan.]