Mistral Small 3 Dirilis

(mistral.ai)

5 poin oleh GN⁺ 2025-01-31 | 1 komentar | Bagikan ke WhatsApp

Tim Mistral AI merilis model 24B-parameter bernama Mistral Small 3 dengan lisensi Apache 2.0.
Model ini dapat bersaing dengan model yang lebih besar seperti Llama 3.3 70B atau Qwen 32B, serta cocok sebagai alternatif untuk model proprietary seperti GPT4o-mini.
Mistral Small 3 dirancang dengan ukuran yang cocok untuk deployment lokal, dengan jumlah layer yang lebih sedikit sehingga waktu pemrosesan lebih singkat.
Model ini menunjukkan akurasi di atas 81% pada MMLU, dengan latensi 150 tokens/s.

Kinerja

Evaluasi manusia

Bersama penyedia evaluasi eksternal, mereka menilai lebih dari 1.000 set prompt coding dan prompt umum.
Preferensi dievaluasi dengan membandingkan respons Mistral Small 3 dan model lainnya.
Mereka berhati-hati untuk memastikan evaluasi yang adil dan yakin pada validitas benchmark tersebut.

Kinerja instruksi

Model instruction-tuned ini menunjukkan kinerja yang kompetitif dengan model terbuka yang ukurannya tiga kali lebih besar serta model GPT4o-mini.
Model ini mencatat akurasi tinggi pada benchmark kode, matematika, pengetahuan umum, dan pelaksanaan instruksi.

Kinerja pretraining

Mistral Small 3 adalah model 24B yang memberikan performa terbaik untuk ukurannya dan mampu bersaing dengan model yang tiga kali lebih besar seperti Llama 3.3 70B.

Kasus penggunaan Mistral Small 3

Dukungan percakapan dengan respons cepat: Sangat unggul untuk skenario yang membutuhkan respons cepat dan akurat.
Function calling berlatensi rendah: Dapat menangani eksekusi fungsi dengan cepat dalam workflow otomatis.
Pembuatan ahli untuk domain khusus: Dapat di-fine-tune untuk domain tertentu guna menghasilkan model ahli dengan akurasi tinggi.
Inferensi lokal: Berguna bagi individu atau organisasi yang menangani informasi sensitif.

Menggunakan Mistral Small 3 di stack teknologi pilihan Anda

Mistral Small 3 tersedia di la Plateforme sebagai mistral-small-latest atau mistral-small-2501.
Mereka bekerja sama dengan Hugging Face, Ollama, Kaggle, Together AI, dan Fireworks AI untuk menyediakan model ini di berbagai platform.

Rencana ke depan

Mistral Small 3 melengkapi model reasoning open source berskala besar seperti DeepSeek, dan dapat digunakan sebagai model dasar yang kuat untuk memperkuat kemampuan reasoning.
Model yang lebih kecil dan model yang lebih besar akan dirilis di masa mendatang.

Model open source Mistral

Mereka berencana menyediakan model tujuan umum dengan lisensi Apache 2.0.
Bobot model dapat diunduh dan di-deploy secara lokal, serta bebas dimodifikasi dan digunakan.
Model ini juga akan tersedia melalui serverless API, deployment on-premises dan VPC, serta platform kustomisasi dan orkestrasi.

1 komentar

GN⁺ 2025-01-31

Opini Hacker News

Model Mistral Small ditujukan sebagai model optimal yang bisa dijalankan di laptop dengan performa yang memadai, dan sedang dibandingkan dengan Llama 3.3 70B serta Qwen 2.5 32B
- Sedang dijalankan melalui Ollama di MacBook Pro M2 64GB, dan terasa cepat serta berkinerja baik
- Perlu mengunduh bobot model sebesar 14GB
Tom dari Epoch AI sedang membangun infrastruktur untuk melakukan evaluasi LLM secara sistematis dan dalam skala besar
- Evaluasi dilakukan menggunakan library Inspect dari pemerintah Inggris
- Mistral Small 3 diuji pada MATH level 5 dan memperoleh akurasi 0.45
- Akurasi rata-rata diukur dengan melakukan sampling 8 kali untuk 1.324 pertanyaan
Beralih ke lisensi Apache 2.0 sehingga keluar dari lisensi nonkomersial
Setelah mencoba prompt pembuatan kode, performanya terlihat mirip dengan qwen2.5-coder-32b
- Mengesankan melihat model kecil menghasilkan output yang semakin canggih
- Ada harapan untuk versi baru model mixtral 8x7B
Poin utama dari rilis kali ini adalah sebagai berikut
- Menggunakan lisensi Apache 2.0
- Latensi rendah (11ms/token)
- Performanya berada di antara Qwen 2.5 32B dan Llama 3.3 70B
- Model Mistral Small berjalan pada kecepatan 9 token/detik
Karena rilis model MoE belakangan ini, 24GB VRAM terasa kurang memadai
- Mistral Small 3 tidak menggunakan RL maupun data sintetis
Model Mistral Small menjawab dengan tepat pertanyaan tentang album pertama Mary J Blige
Ada rasa penasaran tentang alasan menggunakan model kecil
Ada pendapat bahwa akan lebih baik jika nama model menyertakan jumlah parameter

Mistral Small 3 Dirilis

Kinerja

Evaluasi manusia

Kinerja instruksi

Kinerja pretraining

Kasus penggunaan Mistral Small 3

Menggunakan Mistral Small 3 di stack teknologi pilihan Anda

Rencana ke depan

Model open source Mistral

Bacaan terkait

1 komentar

Opini Hacker News