- Grok 4 Fast yang diumumkan xAI adalah model penalaran generasi berikutnya yang memaksimalkan efisiensi biaya dan kecepatan berdasarkan hasil pelatihan Grok 4 yang sudah ada
- Model ini memiliki jendela konteks 2M token, fitur pencarian web dan X, serta arsitektur terpadu reasoning / non-reasoning, sehingga cocok untuk penggunaan real-time
- Dalam benchmark, model ini menunjukkan performa yang mirip dengan Grok 4 sambil menggunakan rata-rata 40% lebih sedikit token, sehingga dapat mencapai kinerja yang sama dengan biaya jauh lebih rendah
- Selain itu, melalui reinforcement learning untuk penggunaan alat, model ini menunjukkan performa tinggi dalam eksekusi kode, penjelajahan web, dan lainnya, serta meraih peringkat 1 di LMArena Search Arena
Kemajuan kecerdasan yang efisien biaya
- Grok 4 Fast menunjukkan performa lebih baik daripada Grok 3 Mini sambil secara signifikan menurunkan biaya token
- Rata-rata mencapai performa serupa dengan Grok 4 dengan menggunakan 40% lebih sedikit 'Thinking Tokens'
- Contoh skor benchmark (pass@1):
- Grok 4 Fast: 85.7%, 92.0%, 93.3%, 20.0%, 80.0%
- Hasil setara atau lebih baik dibanding model pesaing (GPT-5, dll.)
- Pada berbagai benchmark penalaran seperti GPQA, AIME, HMMT, dan LiveCodeBench, model ini menunjukkan hasil yang mendekati Grok 4
- Bersamaan dengan peningkatan efisiensi token Grok 4 Fast sebesar 40%, harga per token juga diturunkan secara signifikan
- Untuk mencapai performa yang sama, biayanya 98% lebih rendah dibanding Grok 4, mencatat 'rasio harga-terhadap-kecerdasan terbaik (SOTA Price-to-Intelligence Ratio)' di antara model yang dipublikasikan
- Hasil ini juga diverifikasi melalui penilaian kuat dalam evaluasi eksternal Artificial Analysis Intelligence Index, sebuah lembaga independen
Pemanfaatan alat native dan pencarian SOTA
- Dilatih dengan reinforcement learning (RL) untuk penggunaan alat, sehingga dapat otomatis menjalankan eksekusi kode atau browsing web saat diperlukan
- Memiliki kemampuan pencarian agentic yang dapat menjelajahi web dan X secara real-time untuk melakukan pencarian multi-hop serta menangani media (gambar, video)
- Pada berbagai benchmark seperti BrowseComp, SimpleQA, dan X Bench Deepsearch(zh), model ini mencapai performa yang melampaui Grok 4
Hasil post-training domain umum
- Di Search Arena milik LMArena, Grok 4 Fast(
menlo) meraih peringkat 1 dengan Elo 1163, unggul 17 poin dari model pesaing
- Di Text Arena,
grok-4-fast (codename tahoe) berada di peringkat 8, jauh lebih unggul dibanding model lain sekelasnya (peringkat 18 ke bawah)
- Dalam tugas pencarian dan teks nyata, model ini menunjukkan efisiensi yang melampaui model besar
Model terpadu Reasoning dan Non-Reasoning
- Mode reasoning / non-reasoning yang sebelumnya memerlukan model terpisah kini diintegrasikan dalam arsitektur tunggal
- Mode reasoning (pemikiran mendalam) dan non-reasoning (jawaban cepat) dapat dialihkan hanya dengan system prompt
- Penurunan latensi end-to-end dan biaya token membuatnya cocok untuk aplikasi real-time
- Di xAI API, developer dapat mengatur kecepatan/kedalaman secara lebih rinci
Distribusi dan kebijakan harga
- Grok 4 Fast sudah dapat langsung digunakan, dan tersedia gratis untuk sementara di OpenRouter dan Vercel AI Gateway
- Di xAI API, model ini juga tersedia dalam dua versi,
grok-4-fast-reasoning dan grok-4-fast-non-reasoning, dengan dukungan jendela konteks 2M token
- Harga dimulai dari token input $0.20/1M dan token output $0.50/1M, dengan tarif 2x berlaku untuk penggunaan di atas 128k token
- Token input cache tersedia di $0.05/1M, membantu penghematan biaya
Rencana ke depan
- Model akan terus ditingkatkan dengan mencerminkan masukan pengguna
- Fitur multimodal dan penguatan karakteristik agentic menjadi target utama pembaruan berikutnya
- Model card dan detail tambahan dapat dilihat melalui Grok 4 Fast model card (PDF)
2 komentar
Kelihatannya lebih mahal dan lebih lambat daripada gpt-oss, jadi saya penasaran kenapa banyak orang memakainya..
Komentar Hacker News
grok-code-fast-1, jadi agak disayangkan produk baru kali ini tidak menyebutnya; saya berharap mungkin ada versi yang lebih baik,grok-code-fast-1memang sedikit di bawah Gemini 2.5 Pro, tetapi untuk kecepatan iterasi itu yang terbaiksonoma-duskyang dulu sempat tersedia sebagai preview di OpenRouter, model itu cukup berguna; saya mengujinya pada tugas reverse engineering kode, dan kecepatan maupun performanya mirip atau bahkan lebih baik daripada gpt5-mini, sanggup bertahan cukup baik sampai 110 ribu~130 ribu token, dan setelah itu mulai cenderung mengklaim sudah selesai meski kondisinya belum cukup terpenuhi (misalnya: xx dari 400 tes lolos, sisanya bisa nanti)