Debut MiniMax-M3, melampaui GPT-5.5 dan Gemini 3.1 Pro di benchmark utama dengan biaya hanya 5-10%

(venturebeat.com)

12 poin oleh recast7838 2026-06-02 | 6 komentar | Bagikan ke WhatsApp

Startup AI asal Tiongkok, MiniMax, secara resmi meluncurkan model bahasa besar multimodal berbasis open weights, 'M3', yang melampaui GPT-5.5 dan Gemini 3.1 Pro dengan biaya yang sangat agresif, hanya sekitar 5~10% dibanding model komersial AS yang ada saat ini.

Terjemahan lengkap

Startup AI asal Tiongkok, MiniMax, resmi meluncurkan model bahasa besar multimodal 'M3' dengan performa coding kelas frontier dan jendela konteks 1 juta token, memicu guncangan besar di pasar AI perusahaan global. M3 akan didistribusikan dalam 10 hari ke depan melalui Hugging Face dan GitHub dengan lisensi open source 'Open Weights', sehingga perusahaan dapat mengunduhnya secara lokal ke server internal dan melakukan optimasi kustom. Saat ini model ini ditawarkan dengan harga peluncuran spesial sebesar $0,3 per 1 juta token input dan $1,20 per token output (total biaya $1,50 {b:4}), dan bahkan setelah harga normal berlaku, biayanya tetap hanya sekitar 8~20% {p:14} dari model komersial utama AS, sehingga unggul telak dari sisi biaya dibanding raksasa teknologi AS seperti Google, OpenAI, dan Anthropic.

Kunci utama di balik penghematan biaya dramatis M3 adalah arsitektur 'MiniMax Sparse Attention (MSA)', yang mengatasi ledakan biaya komputasi kuadratik pada transformer konvensional. Teknologi MSA memaksimalkan efisiensi hardware dengan membagi data ke dalam blok presisi tinggi dan mencocokkan hanya query yang diperlukan secara dinamis; saat memproses 1 juta token, kebutuhan komputasinya turun menjadi sekitar 1/20 {p:5} dari pendekatan lama dan kecepatan decoding meningkat hingga 15 kali lipat. Berkat inovasi struktural ini, M3 mencatat 59,0% {p:59} pada SWE-Bench Pro, yang mengevaluasi kemampuan rekayasa perangkat lunak otonom, mengungguli model tertutup seperti GPT-5.5 maupun Gemini 3.1 Pro. Dalam performa web browsing dan pencarian informasi (BrowseComp 83,5% {p:84}), model ini juga melampaui rekor Claude Opus 4.7 sebelumnya.

Dibandingkan dengan model tertutup berperforma tertinggi yang baru dirilis, Claude Opus 4.8 (SWE-Bench Pro 69,2% {b:59,69}), masih ada selisih performa tertentu di area penalaran ultra-sulit, tetapi M3 tetap menghadirkan tolok ukur otomasi lokal yang kuat tanpa biaya langganan API yang sangat besar. Selain itu, MiniMax juga memperkenalkan lini agen 'MiniMax Code' yang ditenagai M3, yang dapat menulis kode sendiri, menjalankan loop verifikasi independen, dan memperbaiki dirinya secara otonom, dengan paket harga agresif mulai dari $20 per bulan (Plus). Di lingkungan perusahaan yang menuntut privasi data ketat dan kepatuhan regulasi, penyediaan open weights pada M3 diharapkan dapat memblokir secara mendasar risiko kebocoran data cloud sekaligus memberi nilai terbaik untuk menginternalisasi aset inti khas perusahaan

Komentar penulis

Sepertinya saya perlu mencobanya di ollama cloud

6 komentar

jimmy2056 2026-06-03

Karena ini model dari Tiongkok, rasanya agak enggan memakainya lewat API; akan bagus kalau bisa dijalankan secara lokal.

recast7838 2026-06-02

Saya sedang memakainya sekarang, dan tidak ada masalah seperti model Tiongkok lain yang tiba-tiba mengeluarkan bahasa Mandarin saat sedang menulis. Sepertinya tool call-nya juga bekerja dengan baik.

somang04 2026-06-08

Saya sedang menggunakan model berlangganan minimax, dan dengan 100 dolar per tahun.. pemakaiannya benar-benar lebih dari cukup. Bahkan di situ juga dimungkinkan membuat 100 lagu audio per hari. (Meski kadang ada juga lagu bergaya country yang dibuat dalam bahasa Mandarin secara konyol..)

Sepertinya ini cocok sebagai versi minor dari suno atau flow, dan bagus juga untuk dibuat sebagai BGM.

Saya belum mencobanya untuk coding atau sisi agent. Tapi sepertinya perlu dites dengan membandingkannya dengan API gemini / open ai / anthropic.

vndk2234 2026-06-03

Bagaimana bisa harganya keluar di level GPT nano...
Kalau saat memakai AI bukan tipe orang yang mengunggah KTP sendiri, sepertinya pakai produk Tiongkok juga tidak akan jadi masalah besar

runableapp 2026-06-03

Karena ini model dari China, saya masih agak enggan menggunakannya. Namun, saya jadi berpikir kalau tanpa layanan-layanan China seperti ini, kira-kira seberapa tinggi perusahaan-perusahaan AS akan menaikkan harga layanannya. Saya juga curiga jangan-jangan ada kaitannya dengan Trump mengeluarkan kebijakan seperti itu.

b8g6pn 2026-06-02

Standar model yang dianggap sebanding itu sebenarnya mungkin agak dilebih-lebihkan, tapi harganya benar-benar mengejutkan.

Debut MiniMax-M3, melampaui GPT-5.5 dan Gemini 3.1 Pro di benchmark utama dengan biaya hanya 5-10%

Terjemahan lengkap

Komentar penulis

Bacaan terkait

6 komentar