- Model bahasa besar open-source yang dapat digunakan untuk riset maupun keperluan komersial
- Dilatih dengan 2 triliun token data, 40% lebih banyak dibanding Llama 1
- Panjang konteks 2x lebih besar: 4096
- Tiga ukuran model: 7B, 13B, 70B
- Menunjukkan performa yang lebih baik daripada model bahasa open-source lain di banyak benchmark seperti penalaran, coding, kemahiran, dan pengujian pengetahuan (MPT, Falcon, Llama-1)
- Dilatih dengan sumber data yang dipublikasikan, dan Llama-2-chat yang telah di-fine-tune juga memanfaatkan instruction set yang dipublikasikan serta lebih dari satu juta anotasi manusia
- Yang disertakan dalam unduhan
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
3 komentar
Kali ini apakah seseorang akan membocorkan magnet torrent lagi dengan dalih "kepentingan umum"?
Kali ini tidak perlu, langsung diumumkan.
Meski ada perbedaan menurut bidangnya, tampaknya penilaiannya hampir mendekati GPT-3.5 atau bahkan lebih unggul.
Kelihatannya benar-benar terbuka, tetapi ada satu batasan penting. Jika itu adalah "layanan dengan MAU lebih dari 700 juta", maka harus meminta lisensi ke Meta, dan Meta bisa menolaknya.
Sepertinya maksudnya, "Google, TikTok, kalian jangan pakai!"
Microsoft dengan cepat merilis agar Llama 2 bisa digunakan di Azure.
https://blogs.microsoft.com/blog/2023/…
Microsoft tampaknya menjaga hubungan baik dengan OpenAI, dan juga dengan Meta