16 poin oleh xguru 2023-05-08 | 3 komentar | Bagikan ke WhatsApp
  • Model 15.5B yang dilatih dengan 1 triliun token untuk 80+ bahasa pemrograman
  • Untuk generasi yang efisien, menggunakan MQA dan memiliki jendela konteks 8192 token
    • StarCoderBase: dilatih dengan dataset The-Stack v1.2 (6TB) yang berisi data dari lebih dari 80 bahasa
    • StarCoder: model yang dilatih lebih lanjut khusus untuk Python
  • Menyediakan demo chat dan ekstensi untuk VSCode

3 komentar

 
ninebow 2023-05-08

Ini tautan makalah yang ada di postingan pengumuman Twitter. :)

https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view

 
ninebow 2023-05-08

Ternyata juga sudah dirilis agar bisa langsung digunakan di HuggingFace Chat. :)
https://huggingface.co/chat/?model=bigcode/starcoder