Meta merilis model bahasa generasi berikutnya, Llama 2

xguru · 2023-07-19T10:02:01+09:00

Model bahasa besar open-source yang dapat digunakan untuk riset maupun keperluan komersial Dilatih dengan 2 triliun token data, 40% lebih banyak dibanding Llama 1 Panjang konteks 2x lebih besar: 4096 Tiga ukuran model: 7B, 13B, 70B Menunjukkan performa yang lebih baik daripada model bahasa open-source lain di banyak benchmark seperti penalaran, coding, kemahiran, dan pengujian pengetahuan (MPT, Falcon, Llama-1) Dilatih dengan sumber data yang dipublikasikan, dan Llama-2-chat yang telah di-fine-tune juga memanfaatkan instruction set yang dipublikasikan serta lebih dari satu juta anotasi manusia Yang disertakan dalam unduhan Model code Model Weights README (User Guide) Responsible Use Guide License Acceptable Use Policy Model Card

(ai.meta.com)

19 poin oleh xguru 2023-07-19 | 3 komentar | Bagikan ke WhatsApp

Model bahasa besar open-source yang dapat digunakan untuk riset maupun keperluan komersial
Dilatih dengan 2 triliun token data, 40% lebih banyak dibanding Llama 1
Panjang konteks 2x lebih besar: 4096
Tiga ukuran model: 7B, 13B, 70B
Menunjukkan performa yang lebih baik daripada model bahasa open-source lain di banyak benchmark seperti penalaran, coding, kemahiran, dan pengujian pengetahuan (MPT, Falcon, Llama-1)
Dilatih dengan sumber data yang dipublikasikan, dan Llama-2-chat yang telah di-fine-tune juga memanfaatkan instruction set yang dipublikasikan serta lebih dari satu juta anotasi manusia
Yang disertakan dalam unduhan
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card

3 komentar

kuroneko 2023-07-19

Kali ini apakah seseorang akan membocorkan magnet torrent lagi dengan dalih "kepentingan umum"?

tpdns90321 2023-07-19

Kali ini tidak perlu, langsung diumumkan.

xguru 2023-07-19

Meski ada perbedaan menurut bidangnya, tampaknya penilaiannya hampir mendekati GPT-3.5 atau bahkan lebih unggul.

Kelihatannya benar-benar terbuka, tetapi ada satu batasan penting. Jika itu adalah "layanan dengan MAU lebih dari 700 juta", maka harus meminta lisensi ke Meta, dan Meta bisa menolaknya.

Sepertinya maksudnya, "Google, TikTok, kalian jangan pakai!"

Microsoft dengan cepat merilis agar Llama 2 bisa digunakan di Azure.
https://blogs.microsoft.com/blog/2023/…

Microsoft tampaknya menjaga hubungan baik dengan OpenAI, dan juga dengan Meta

Meta merilis model bahasa generasi berikutnya, Llama 2

Bacaan terkait

3 komentar