- Magistral adalah model penalaran (reasoning) pertama yang dirilis Mistral AI, dengan fokus pada spesialisasi domain, transparansi, dan penalaran multibahasa
- Dirilis dalam dua varian: Magistral Small (24B parameter) yang open source dan Magistral Medium versi enterprise untuk bisnis
- Menyediakan penalaran multibahasa berbasis Chain of Thought, dengan proses logika bertahap yang ditampilkan secara transparan dalam bahasa pengguna
- Pada AIME2024, Magistral Medium mencatat 73.6% (tertinggi 90%), dan Small 70.7% (tertinggi 83.3%)
- Mendukung pengembangan logika bertahap yang akurat serta kecepatan respons 10 kali lebih cepat untuk berbagai bahasa dan industri seperti sektor teregulasi termasuk hukum, keuangan, dan layanan kesehatan, data engineering, pengembangan perangkat lunak, serta konten kreatif
Magistral — Mistral AI mengumumkan model penalaran pertamanya
- Magistral adalah model reasoning yang berfokus pada kemampuan memecahkan masalah dunia nyata dan peningkatan berbasis umpan balik
- Magistral Small adalah versi open source 24B parameter, sementara Magistral Medium adalah versi enterprise yang lebih kuat, dirilis dalam dua varian
- Metrik performa:
- Magistral Medium: AIME2024 73.6%, mencapai 90% berdasarkan voting mayoritas
- Magistral Small: masing-masing 70.7%, 83.3%
- Menerapkan penalaran Chain of Thought berbasis bahasa dan aksara global, memungkinkan alur berpikir setara bahasa ibu
- Cocok untuk berbagai tugas seperti perhitungan terstruktur, logika pemrograman, decision tree, dan sistem berbasis aturan
- Dengan fitur Think mode dan Flash Answers di Le Chat, kecepatan respons meningkat 10 kali dibanding pesaing
- Makalah resminya memuat evaluasi menyeluruh atas algoritme, infrastruktur pelatihan, teknik reinforcement learning, dan insight pelatihan
Detail model dan teknologi
- Proses penalaran yang transparan:
- Magistral dioptimalkan untuk logika multi-tahap, sehingga pengguna dapat memeriksa dan menelusuri proses penalaran dalam bahasa mereka sendiri
- Berbeda dari model umum, kemampuan interpretabilitas dan verifikasi diperkuat
- Menargetkan pembaruan model berkelanjutan dan peningkatan yang cepat
- Penalaran multibahasa: mempertahankan akurasi dan logika yang tinggi dalam bahasa Inggris, Prancis, Spanyol, Jerman, Italia, Arab, Rusia, Mandarin, dan lainnya
- Kecepatan respons:
- Magistral Medium mendukung penalaran dan umpan balik real-time melalui fitur Flash Answers di Le Chat, dengan kecepatan pemrosesan token 10 kali lebih tinggi dibanding pesaing
- Menunjukkan keunggulan yang menonjol dari sisi kecepatan dibanding model pesaing utama seperti ChatGPT
Open source dan partisipasi komunitas
- Magistral Small dirilis dengan lisensi Apache 2.0
- Pengguna dapat menganalisis, memodifikasi, dan menyusun ulang struktur serta metode penalarannya secara langsung
- Model open source sebelumnya telah dimanfaatkan dalam proyek riset inovatif seperti ether0 dan DeepHermes 3
Beragam contoh penerapan
- Magistral dioptimalkan untuk bidang seperti hukum, keuangan, pengembangan perangkat lunak, dan storytelling, di mana penalaran bertahap yang presisi dan transparansi sangat penting
-
Strategi dan operasi bisnis
- Dapat digunakan untuk perencanaan strategi, penilaian risiko, pengambilan keputusan berbasis data, serta perhitungan solusi optimal di bawah kendala yang kompleks
-
Industri teregulasi dan sektor publik
- Profesional di bidang hukum, keuangan, layanan kesehatan, dan pemerintahan dapat melacak jalur penalaran logis serta memastikan auditabilitas
- Mendukung auditabilitas hasil dan pemenuhan kepatuhan regulasi
-
Sistem, perangkat lunak, dan data engineering
- Dibanding LLM non-reasoning, kualitas dukungan untuk pemrograman, perancangan proyek, arsitektur backend, dan data engineering meningkat
- Efektif untuk tugas multi-langkah seperti integrasi alat eksternal dan API
-
Pembuatan konten dan komunikasi
- Magistral juga menunjukkan hasil unggul dalam penulisan kreatif dan storytelling
- Tidak hanya menghasilkan teks yang konsisten, tetapi juga mampu menciptakan ide-ide yang unik dan jenaka
Cara penggunaan dan jalur distribusi
- Versi Small dapat diunduh dan di-deploy sendiri
- Versi Medium dapat langsung digunakan di Le Chat (web), API, dan Amazon SageMaker
- Dukungan tambahan untuk IBM WatsonX, Azure AI, dan Google Cloud Marketplace akan hadir segera
- Untuk penyesuaian enterprise dan penerapan on-premises, diperlukan pertanyaan terpisah
1 komentar
Komentar Hacker News
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XL, dan untuk llama.cpp sangat disarankan memakai opsi seperti--jinja,--temp 0.7,--top-p 0.95. Disarankan juga menaikkan panjang konteks Ollama ke 8192 atau lebih, dan panduan tambahan tersedia di dokumentasi resmi