- Mengembangkan dan menerapkan teknologi Depth Up-Scaling untuk memaksimalkan kemampuan Llama2 7B yang sudah ada
- Dalam benchmark, model ini menunjukkan performa unggul di antara model dengan kurang dari 30 miliar parameter, serta melampaui QWEN yang berukuran 6 kali lebih besar maupun model Mixtral 8x7B yang baru dirilis
- Peringkat 1 di leaderboard OpenLLM dengan skor 74,2. QWEN-72B dari Alibaba meraih 73,6, dan Mixtral-8x7B 72,6
- Instruction fine-tuning diterapkan dengan baik
- Karena model yang dirilis kali ini berbasis bahasa Inggris, performanya dalam bahasa Korea mungkin rendah
1 komentar
Upstage adalah pembuat AskUp, AI yang dapat digunakan di KakaoTalk.
Alibaba merilis model AI open source QWEN
Mistral AI merilis model Mixtral 8x7B yang lebih unggul daripada model Llama 2 70B