- Model 3B/7B telah dirilis, model 15B/30B/65B juga akan dirilis dan ada rencana hingga 175B
- Model ini menggunakan lisensi CC BY-SA-4.0 dan dapat digunakan secara komersial dengan atribusi sumber
- Berbasis pada dataset terbuka The Pile, tetapi dilatih dengan dataset baru berukuran 3 kali lebih besar yang memiliki 1.5T token
- Panjang konteks adalah 4096 token
- Sebagai PoC, model StableLM-Tuned-Alpha-7B yang di-fine-tune mengikuti prosedur Alpaca juga dirilis
- Menggunakan 5 dataset percakapan: Stanford's Alpaca, Nomic-AI's gpt4all, RyokoAI's ShareGPT52K datasets, Databricks labs' Dolly, Anthropic's HH
- Demo chatbot tersedia di Hugging Face
2 komentar
Bagus, bagus!
Seperti halnya percepatan pasar yang terjadi setelah Stable Diffusion dirilis secara terbuka, tampaknya model bahasa kini juga akan dibanjiri data dan use case yang dapat digunakan secara publik.