Peluncuran model Mistral Large

(mistral.ai)

8 poin oleh GN⁺ 2024-02-27 | 1 komentar | Bagikan ke WhatsApp

Mistral Large adalah model generasi teks mutakhir dengan kemampuan penalaran kelas atas
Dapat menjalankan tugas penalaran kompleks dalam berbagai bahasa, dan bisa digunakan untuk pemahaman teks, transformasi, serta pembuatan kode
Menunjukkan performa kuat pada benchmark MMLU, dan merupakan model dengan peringkat tertinggi kedua di dunia yang tersedia secara umum melalui API
- 81.2%, setelah GPT-4 86.4%; Claude 2 di 78.5%, Gemini Pro di 71.8%

Fitur baru dan keunggulan Mistral Large

Sangat fasih seperti penutur asli dalam bahasa Inggris, Prancis, Spanyol, Jerman, dan Italia, serta memberikan pemahaman yang bernuansa terhadap tata bahasa dan konteks budaya
Melalui context window 32K token, memungkinkan recall informasi yang akurat dari dokumen berskala besar
Dengan kemampuan mengikuti instruksi secara presisi, pengembang dapat merancang kebijakan moderasi mereka sendiri, dan ini digunakan untuk pengaturan moderasi tingkat sistem di le Chat
Memiliki kemampuan function calling bawaan, sehingga bersama mode output terbatas yang diimplementasikan di la Plateforme, memungkinkan pengembangan aplikasi dan modernisasi tech stack dalam skala besar

Model tersedia di Azure melalui kemitraan dengan Microsoft

Tujuan Mistral adalah mendemokratisasi AI terdepan, dan untuk itu mereka menyediakan model open dan komersial di Azure
Model-model Mistral dapat digunakan melalui La Plateforme dan Azure, serta dapat dideploy langsung ke lingkungan pengguna
La Plateforme di-host dengan aman di infrastruktur Eropa milik Mistral, sementara Azure disediakan melalui Azure AI Studio dan Azure Machine Learning
Self-deployment memungkinkan akses ke bobot model untuk use case yang paling sensitif, dan Anda dapat membaca kisah sukses serta menghubungi tim untuk mendapatkan informasi lebih lanjut

Kemampuan Mistral Large

Mistral Large menunjukkan kemampuan penalaran yang kuat dibandingkan model-model LLM terdepan pada benchmark standar
Dalam kemampuan multibahasa, Mistral Large juga jauh melampaui LLaMA 2 70B dalam bahasa Prancis, Jerman, Spanyol, dan Italia
Juga menunjukkan performa terbaik dalam tugas coding dan matematika

Mistral Small baru, dioptimalkan untuk workload latensi rendah

Bersamaan dengan Mistral Large, dirilis juga model baru Mistral Small yang dioptimalkan untuk latensi dan biaya
Mistral Small memiliki performa lebih baik dan latensi lebih rendah dibanding Mixtral 8x7B, sehingga menjadi solusi menengah yang disempurnakan antara penawaran open-weight dan model flagship
Mistral Small memanfaatkan inovasi aktivasi RAG dan function calling yang sama seperti Mistral Large
Menyediakan endpoint open-weight dengan harga kompetitif dan endpoint model baru yang telah dioptimalkan, sehingga memberikan pandangan komprehensif atas trade-off performa/biaya

Format JSON dan function calling

Mode format JSON memaksa output model bahasa agar menjadi JSON yang valid
Melalui function calling, pengembang dapat menghubungkan set alat mereka sendiri dengan endpoint Mistral untuk memungkinkan interaksi yang lebih kompleks dengan kode internal, API, atau database
Function calling dan format JSON hanya tersedia di mistral-small dan mistral-large, dan dukungan format untuk semua endpoint akan segera ditambahkan

Opini GN⁺

Mistral Large adalah model bahasa AI dengan dukungan multibahasa dan kemampuan penalaran tingkat lanjut, dan kemampuannya untuk menjalankan tugas kompleks dalam berbagai bahasa sangat patut diperhatikan.
Model ini memiliki potensi untuk bersaing dengan model yang sudah ada seperti GPT-4, dan khususnya dukungan terhadap berbagai bahasa meningkatkan kemungkinan penerapannya di pasar global.
Kemitraan dengan Azure memberi peluang bagi model Mistral AI untuk menjangkau basis pengguna yang lebih luas, sekaligus memperkuat skalabilitas dan aksesibilitas layanan AI berbasis cloud.
Peluncuran model teroptimasi seperti Mistral Small dapat menjadi opsi menarik bagi perusahaan yang membutuhkan solusi AI yang hemat biaya dan berlatensi rendah.
Fitur format JSON dan function calling memudahkan pengembang untuk mengintegrasikan model AI ke dalam aplikasi mereka, sehingga meningkatkan kepraktisan dan fleksibilitas teknologi AI.

1 komentar

GN⁺ 2024-02-27

Komentar Hacker News

Mengapresiasi keterusterangan materi pemasarannya. Menampilkan skor benchmark yang lebih rendah dibanding produk pemimpin pasar dianggap lebih baik daripada Google yang menggunakan benchmark secara selektif.
Mereka sudah melakukan banyak hal, tetapi ada pendapat bahwa akan lebih baik jika ada penegasan ulang janji untuk berkontribusi pada komunitas open source. Itu dianggap sebagai bagian utama dari merek mereka.
Setelah insiden miqu, ada harapan sambil menunggu bahwa lebih banyak open weight akan dirilis, tetapi tampaknya tetap harus menunggu hasilnya.
Pembaruan perubahan: penggantian nama endpoint API dan penambahan endpoint model, peluncuran model baru, serta pemberitahuan pembaruan model lama dan rencana penghentiannya.
Fitur API baru: function calling dan mode JSON kini dapat digunakan pada model Mistral Small dan Mistral Large.
La Plateforme: penambahan sistem pembayaran yang mendukung banyak mata uang dan pengenalan fitur platform untuk perusahaan.
Le Chat: peluncuran antarmuka chat baru untuk berinteraksi dengan model Mistral dengan mudah.
Model baru telah ditambahkan ke plugin untuk alat LLM CLI. Sekarang bisa digunakan seperti berikut.
Mencoba menyelesaikan beberapa masalah coding yang muncul hari ini dengan Le Chat, dan jawabannya jauh lebih baik daripada ChatGPT (termasuk GPT-4). Tidak yakin apakah kualitas ChatGPT memang menurun demi penghematan biaya seperti yang disarankan sebagian orang, tetapi untuk beberapa masalah ini, kualitas jawaban Mistral jauh lebih unggul.
Tidak tahu bahwa Le Chat sudah ada. Sudah lama menginginkan pesaing ChatGPT yang menggunakan Mistral, dan juga suka bahwa mereka menambahkan "le" di depan nama produknya.
Di Azure, Mistral sedikit lebih murah daripada GPT-4.
Muncul pertanyaan apakah semua kehebohan soal open weight sebenarnya sudah berakhir dan apakah modelnya akan tetap tertutup.
Tidak ada informasi tentang ukuran parameter di mana pun, sehingga muncul pertanyaan apakah itu memang disengaja atau ada yang terlewat.
Ini seperti ada beberapa arsitektur CPU yang bisa saling menggantikan. Setiap kali LLM baru dirilis, muncul harapan bahwa monopoli akan jauh berkurang sehingga keadaan menjadi lebih baik. Bahkan tanpa model open source, OpenAI tampaknya sudah mencapai misi mereka.

Peluncuran model Mistral Large

Fitur baru dan keunggulan Mistral Large

Model tersedia di Azure melalui kemitraan dengan Microsoft

Kemampuan Mistral Large

Mistral Small baru, dioptimalkan untuk workload latensi rendah

Format JSON dan function calling

Opini GN⁺

Bacaan terkait

1 komentar

Komentar Hacker News