- Panjang konteks 128K, mendukung 8 bahasa, dan menambahkan model 405B (8B, 70B, 405B)
- Model AI open source instruction-tuned yang dapat di-fine-tune, disempurnakan, dan di-deploy di mana saja oleh siapa pun
- Model 405B yang baru dirilis mencapai performa yang hampir setara atau lebih baik daripada GPT-4o pada benchmark seperti MMLU (umum), Human Eval (coding), dan GSM8K (matematika)
- Model AI kelas atas dalam hal fleksibilitas dan kontrol
- Memungkinkan komunitas memanfaatkan alur kerja baru seperti pembuatan data sintetis dan distilasi model
- Dilatih menggunakan lebih dari 15 triliun token dan memakai lebih dari 16.000 GPU H100
- Model 70B yang ditingkatkan jauh melampaui GPT-3.5 Turbo di sebagian besar benchmark
3 komentar
Wah, jadi penasaran harus menyusun GPU seperti apa kalau mau menjalankan 405B.
Sepertinya 405B bukan untuk fine-tuning atau serving secara langsung. Melihat CEO beberapa kali menyebut distillation, kemungkinan ini ditujukan untuk fine-tuning sebagai model teacher guna meningkatkan kualitas model-model ringan.
Komentar Hacker News
Model-model Llama 3.1 telah meningkatkan performa
Perbandingan GPT-4o dan model Llama 3.1 405B
Di Groq.com, pengguna bisa bercakap dengan model-model baru ini dengan latensi sangat rendah
Dengan perangkat keras yang sesuai, LLM yang dapat bersaing dengan GPT-4o bisa dijalankan di rumah
Model dapat dijalankan secara lokal melalui Ollama, Huggingface, Groq, dan lainnya
Hasil menjalankan versi 70B di Ollama sangat bagus
Claude 3.5 Sonnet sangat bagus untuk pekerjaan coding
Pertanyaan tentang informasi harga model open source