Debut MiniMax-M3, melampaui GPT-5.5 dan Gemini 3.1 Pro di benchmark utama dengan biaya hanya 5-10%
(venturebeat.com)Startup AI asal Tiongkok, MiniMax, secara resmi meluncurkan model bahasa besar multimodal berbasis open weights, 'M3', yang melampaui GPT-5.5 dan Gemini 3.1 Pro dengan biaya yang sangat agresif, hanya sekitar 5~10% dibanding model komersial AS yang ada saat ini.
Terjemahan lengkap
Startup AI asal Tiongkok, MiniMax, resmi meluncurkan model bahasa besar multimodal 'M3' dengan performa coding kelas frontier dan jendela konteks 1 juta token, memicu guncangan besar di pasar AI perusahaan global. M3 akan didistribusikan dalam 10 hari ke depan melalui Hugging Face dan GitHub dengan lisensi open source 'Open Weights', sehingga perusahaan dapat mengunduhnya secara lokal ke server internal dan melakukan optimasi kustom. Saat ini model ini ditawarkan dengan harga peluncuran spesial sebesar $0,3 per 1 juta token input dan $1,20 per token output (total biaya $1,50 ), dan bahkan setelah harga normal berlaku, biayanya tetap hanya sekitar 8~20% {p:14} dari model komersial utama AS, sehingga unggul telak dari sisi biaya dibanding raksasa teknologi AS seperti Google, OpenAI, dan Anthropic.
Kunci utama di balik penghematan biaya dramatis M3 adalah arsitektur 'MiniMax Sparse Attention (MSA)', yang mengatasi ledakan biaya komputasi kuadratik pada transformer konvensional. Teknologi MSA memaksimalkan efisiensi hardware dengan membagi data ke dalam blok presisi tinggi dan mencocokkan hanya query yang diperlukan secara dinamis; saat memproses 1 juta token, kebutuhan komputasinya turun menjadi sekitar 1/20 {p:5} dari pendekatan lama dan kecepatan decoding meningkat hingga 15 kali lipat. Berkat inovasi struktural ini, M3 mencatat 59,0% {p:59} pada SWE-Bench Pro, yang mengevaluasi kemampuan rekayasa perangkat lunak otonom, mengungguli model tertutup seperti GPT-5.5 maupun Gemini 3.1 Pro. Dalam performa web browsing dan pencarian informasi (BrowseComp 83,5% {p:84}), model ini juga melampaui rekor Claude Opus 4.7 sebelumnya.
Dibandingkan dengan model tertutup berperforma tertinggi yang baru dirilis, Claude Opus 4.8 (SWE-Bench Pro 69,2% ), masih ada selisih performa tertentu di area penalaran ultra-sulit, tetapi M3 tetap menghadirkan tolok ukur otomasi lokal yang kuat tanpa biaya langganan API yang sangat besar. Selain itu, MiniMax juga memperkenalkan lini agen 'MiniMax Code' yang ditenagai M3, yang dapat menulis kode sendiri, menjalankan loop verifikasi independen, dan memperbaiki dirinya secara otonom, dengan paket harga agresif mulai dari $20 per bulan (Plus). Di lingkungan perusahaan yang menuntut privasi data ketat dan kepatuhan regulasi, penyediaan open weights pada M3 diharapkan dapat memblokir secara mendasar risiko kebocoran data cloud sekaligus memberi nilai terbaik untuk menginternalisasi aset inti khas perusahaan
Komentar penulis
Sepertinya saya perlu mencobanya di ollama cloud
2 komentar
Standar model yang dianggap sebanding itu sebenarnya mungkin agak dilebih-lebihkan, tapi harganya benar-benar mengejutkan.
Saya sedang memakainya sekarang, dan tidak ada masalah seperti model Tiongkok lain yang tiba-tiba mengeluarkan bahasa Mandarin saat sedang menulis. Sepertinya
tool call-nya juga bekerja dengan baik.