9 poin oleh xguru 2023-12-15 | 1 komentar | Bagikan ke WhatsApp
  • Mengembangkan dan menerapkan teknologi Depth Up-Scaling untuk memaksimalkan kemampuan Llama2 7B yang sudah ada
  • Dalam benchmark, model ini menunjukkan performa unggul di antara model dengan kurang dari 30 miliar parameter, serta melampaui QWEN yang berukuran 6 kali lebih besar maupun model Mixtral 8x7B yang baru dirilis
    • Peringkat 1 di leaderboard OpenLLM dengan skor 74,2. QWEN-72B dari Alibaba meraih 73,6, dan Mixtral-8x7B 72,6
  • Instruction fine-tuning diterapkan dengan baik
  • Karena model yang dirilis kali ini berbasis bahasa Inggris, performanya dalam bahasa Korea mungkin rendah