- Model bahasa besar open-source yang dapat digunakan untuk riset maupun keperluan komersial
- Dilatih dengan 2 triliun token data, 40% lebih banyak dibanding Llama 1
- Panjang konteks 2x lipat: 4096
- Tiga ukuran model: 7B, 13B, 70B
- Menunjukkan performa yang lebih baik daripada model bahasa open-source lain pada banyak benchmark seperti penalaran, coding, kemahiran, dan pengujian pengetahuan (MPT, Falcon, Llama-1)
- Dilatih menggunakan sumber data yang dipublikasikan, dan Llama-2-chat yang telah di-fine-tune juga memanfaatkan set instruksi yang dipublikasikan serta lebih dari satu juta anotasi manusia
- Menggunakan Reinforcement Learning from Human Feedback (RLHF), termasuk Rejection Sampling dan Proximal Policy Optimization (PPO)
- Yang termasuk dalam unduhan
- Kode model
- Bobot model
- README (Panduan Pengguna)
- Panduan Penggunaan yang Bertanggung Jawab
- Lisensi
- Kebijakan Penggunaan yang Dapat Diterima
- Kartu Model
1 komentar
Opini Hacker News