- Mistral Large adalah model generasi teks mutakhir dengan kemampuan penalaran kelas atas
- Dapat menjalankan tugas penalaran kompleks dalam berbagai bahasa, dan bisa digunakan untuk pemahaman teks, transformasi, serta pembuatan kode
- Menunjukkan performa kuat pada benchmark MMLU, dan merupakan model dengan peringkat tertinggi kedua di dunia yang tersedia secara umum melalui API
- 81.2%, setelah GPT-4 86.4%; Claude 2 di 78.5%, Gemini Pro di 71.8%
Fitur baru dan keunggulan Mistral Large
- Sangat fasih seperti penutur asli dalam bahasa Inggris, Prancis, Spanyol, Jerman, dan Italia, serta memberikan pemahaman yang bernuansa terhadap tata bahasa dan konteks budaya
- Melalui context window 32K token, memungkinkan recall informasi yang akurat dari dokumen berskala besar
- Dengan kemampuan mengikuti instruksi secara presisi, pengembang dapat merancang kebijakan moderasi mereka sendiri, dan ini digunakan untuk pengaturan moderasi tingkat sistem di le Chat
- Memiliki kemampuan function calling bawaan, sehingga bersama mode output terbatas yang diimplementasikan di la Plateforme, memungkinkan pengembangan aplikasi dan modernisasi tech stack dalam skala besar
Model tersedia di Azure melalui kemitraan dengan Microsoft
- Tujuan Mistral adalah mendemokratisasi AI terdepan, dan untuk itu mereka menyediakan model open dan komersial di Azure
- Model-model Mistral dapat digunakan melalui La Plateforme dan Azure, serta dapat dideploy langsung ke lingkungan pengguna
- La Plateforme di-host dengan aman di infrastruktur Eropa milik Mistral, sementara Azure disediakan melalui Azure AI Studio dan Azure Machine Learning
- Self-deployment memungkinkan akses ke bobot model untuk use case yang paling sensitif, dan Anda dapat membaca kisah sukses serta menghubungi tim untuk mendapatkan informasi lebih lanjut
Kemampuan Mistral Large
- Mistral Large menunjukkan kemampuan penalaran yang kuat dibandingkan model-model LLM terdepan pada benchmark standar
- Dalam kemampuan multibahasa, Mistral Large juga jauh melampaui LLaMA 2 70B dalam bahasa Prancis, Jerman, Spanyol, dan Italia
- Juga menunjukkan performa terbaik dalam tugas coding dan matematika
Mistral Small baru, dioptimalkan untuk workload latensi rendah
- Bersamaan dengan Mistral Large, dirilis juga model baru Mistral Small yang dioptimalkan untuk latensi dan biaya
- Mistral Small memiliki performa lebih baik dan latensi lebih rendah dibanding Mixtral 8x7B, sehingga menjadi solusi menengah yang disempurnakan antara penawaran open-weight dan model flagship
- Mistral Small memanfaatkan inovasi aktivasi RAG dan function calling yang sama seperti Mistral Large
- Menyediakan endpoint open-weight dengan harga kompetitif dan endpoint model baru yang telah dioptimalkan, sehingga memberikan pandangan komprehensif atas trade-off performa/biaya
Format JSON dan function calling
- Mode format JSON memaksa output model bahasa agar menjadi JSON yang valid
- Melalui function calling, pengembang dapat menghubungkan set alat mereka sendiri dengan endpoint Mistral untuk memungkinkan interaksi yang lebih kompleks dengan kode internal, API, atau database
- Function calling dan format JSON hanya tersedia di mistral-small dan mistral-large, dan dukungan format untuk semua endpoint akan segera ditambahkan
Opini GN⁺
- Mistral Large adalah model bahasa AI dengan dukungan multibahasa dan kemampuan penalaran tingkat lanjut, dan kemampuannya untuk menjalankan tugas kompleks dalam berbagai bahasa sangat patut diperhatikan.
- Model ini memiliki potensi untuk bersaing dengan model yang sudah ada seperti GPT-4, dan khususnya dukungan terhadap berbagai bahasa meningkatkan kemungkinan penerapannya di pasar global.
- Kemitraan dengan Azure memberi peluang bagi model Mistral AI untuk menjangkau basis pengguna yang lebih luas, sekaligus memperkuat skalabilitas dan aksesibilitas layanan AI berbasis cloud.
- Peluncuran model teroptimasi seperti Mistral Small dapat menjadi opsi menarik bagi perusahaan yang membutuhkan solusi AI yang hemat biaya dan berlatensi rendah.
- Fitur format JSON dan function calling memudahkan pengembang untuk mengintegrasikan model AI ke dalam aplikasi mereka, sehingga meningkatkan kepraktisan dan fleksibilitas teknologi AI.
1 komentar
Komentar Hacker News
Mengapresiasi keterusterangan materi pemasarannya. Menampilkan skor benchmark yang lebih rendah dibanding produk pemimpin pasar dianggap lebih baik daripada Google yang menggunakan benchmark secara selektif.
Mereka sudah melakukan banyak hal, tetapi ada pendapat bahwa akan lebih baik jika ada penegasan ulang janji untuk berkontribusi pada komunitas open source. Itu dianggap sebagai bagian utama dari merek mereka.
Setelah insiden miqu, ada harapan sambil menunggu bahwa lebih banyak open weight akan dirilis, tetapi tampaknya tetap harus menunggu hasilnya.
Pembaruan perubahan: penggantian nama endpoint API dan penambahan endpoint model, peluncuran model baru, serta pemberitahuan pembaruan model lama dan rencana penghentiannya.
Fitur API baru: function calling dan mode JSON kini dapat digunakan pada model Mistral Small dan Mistral Large.
La Plateforme: penambahan sistem pembayaran yang mendukung banyak mata uang dan pengenalan fitur platform untuk perusahaan.
Le Chat: peluncuran antarmuka chat baru untuk berinteraksi dengan model Mistral dengan mudah.
Model baru telah ditambahkan ke plugin untuk alat LLM CLI. Sekarang bisa digunakan seperti berikut.
Mencoba menyelesaikan beberapa masalah coding yang muncul hari ini dengan Le Chat, dan jawabannya jauh lebih baik daripada ChatGPT (termasuk GPT-4). Tidak yakin apakah kualitas ChatGPT memang menurun demi penghematan biaya seperti yang disarankan sebagian orang, tetapi untuk beberapa masalah ini, kualitas jawaban Mistral jauh lebih unggul.
Tidak tahu bahwa Le Chat sudah ada. Sudah lama menginginkan pesaing ChatGPT yang menggunakan Mistral, dan juga suka bahwa mereka menambahkan "le" di depan nama produknya.
Di Azure, Mistral sedikit lebih murah daripada GPT-4.
Muncul pertanyaan apakah semua kehebohan soal open weight sebenarnya sudah berakhir dan apakah modelnya akan tetap tertutup.
Tidak ada informasi tentang ukuran parameter di mana pun, sehingga muncul pertanyaan apakah itu memang disengaja atau ada yang terlewat.
Ini seperti ada beberapa arsitektur CPU yang bisa saling menggantikan. Setiap kali LLM baru dirilis, muncul harapan bahwa monopoli akan jauh berkurang sehingga keadaan menjadi lebih baik. Bahkan tanpa model open source, OpenAI tampaknya sudah mencapai misi mereka.