- grok-code-fast-1 yang dirilis xAI adalah model coding AI supercepat untuk developer, dengan respons sangat cepat dan fitur yang ramah IDE
- Model ini dipra-latih dengan fokus pada dataset pemrograman dan dirancang agar mahir menggunakan alat seperti grep, terminal, dan pengeditan file melalui evaluasi pengguna nyata
- Performanya mencatat kecepatan generasi 190 token per detik dan skor 70,8% di SWE-Bench-Verified, serta unggul dalam banyak bahasa seperti TypeScript, Python, Java, Rust, C++, Go
- Harganya ditetapkan $0,20 per 1 juta token input, $1,50 untuk output, dan $0,02 untuk input cache, dan di beberapa platform mitra (GitHub Copilot, Cursor, dll.) tersedia gratis untuk sementara
- Varian model yang mendukung input multimodal, pemanggilan alat paralel, dan konteks yang diperluas juga akan segera dirilis
Gambaran umum
- grok-code-fast-1 dari xAI adalah model coding AI supercepat yang dikembangkan untuk mengatasi masalah penurunan kecepatan di lingkungan pengembangan nyata, tempat pemikiran iteratif dan penggunaan alat sering terjadi
- Berdasarkan masukan dari engineer praktisi, model ini dibangun ulang dari nol dengan arsitektur yang cepat, lincah, dan cocok untuk pekerjaan nyata
- Tim engineering inferensi dan komputasi memperkenalkan berbagai metode inovatif pada teknologi layanan (serving) yang sangat cepat
- Pengguna dapat merasakan pengalaman di mana beberapa pemanggilan alat sudah terjadi bahkan sebelum sempat membaca alur pikirannya
- Dengan optimasi prompt caching, model ini mencapai rasio cache hit lebih dari 90% di lingkungan mitra
Desain dan dataset
- Lingkungan pelatihan dibangun berdasarkan data pretraining berskala besar yang berfokus pada pemrograman
- Post-training berkualitas tinggi dilakukan menggunakan data pull request dan penulisan kode nyata
- Dengan bekerja erat bersama berbagai mitra peluncuran, perilaku model dalam platform agentic terus ditingkatkan
Fitur utama dan lingkungan yang didukung
grok-code-fast-1 mampu menggunakan alat pengembangan umum seperti grep, terminal, dan pengeditan file dengan andal
- Pengguna dapat langsung memakainya di lingkungan pengembangan utama seperti IDE
Performa pemrograman
- Mendukung seluruh stack pengembangan perangkat lunak
- Menunjukkan kegunaan yang sangat baik pada TypeScript, Python, Java, Rust, C++, Go dan lainnya
- Bahkan dengan pengawasan minimal, model ini dapat menangani berbagai tugas pemrograman dengan cepat dan akurat, seperti membuat proyek dari nol, tanya jawab pada codebase, dan perbaikan bug presisi
- Grok Code Fast 1 menawarkan responsivitas tercepat di antara model yang ada saat ini
- Jika digunakan dengan membagi pekerjaan ke unit-unit kecil, model ini sangat menguntungkan untuk membangun alur kerja yang iteratif dan cepat
- Sebagai contoh nyata, sebuah prototipe Battle Simulator diselesaikan hanya dalam satu hari di lingkungan Cursor
- Merencanakan fitur besar, memecahnya menjadi beberapa tahap, lalu mengeksekusinya secara iteratif adalah pendekatan yang efisien
Kebijakan harga
- $0,20 per 1 juta token input
- $1,50 per 1 juta token output
- $0,02 per 1 juta token input yang di-cache
- Dengan performa tinggi dan harga yang ekonomis, model ini dapat menangani tugas pemrograman harian dengan cepat dan efisien
Kinerja model dan evaluasi
- Kecepatan pemrosesan token (Tokens Per Second, TPS): 190, termasuk yang terbaik di industri
- Dibandingkan dengan model lain (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4), model ini menunjukkan daya saing kuat baik dalam harga maupun kecepatan pemrosesan
- Menggabungkan berbagai benchmark publik dan pengujian nyata oleh developer
- Mencapai 70,8% pada subset SWE-Bench-Verified
- Dengan menggabungkan evaluasi manusia berkala bersama engineer praktisi dan pengujian otomatis, model ini memaksimalkan kegunaan praktis dan tingkat kepuasan
Rencana ke depan dan panduan penggunaan
- Tersedia melalui API resmi dan mitra utama, serta uji coba gratis juga tersedia untuk sementara
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf, dll.
- Menjanjikan pembaruan berkelanjutan dan siklus perbaikan yang cepat
- Varian baru yang mencakup fitur seperti input multimodal, pemanggilan alat paralel, dan dukungan konteks yang diperluas sedang dilatih
- Panduan prompt engineering juga disediakan terpisah
- Pendapat dapat dibagikan melalui model card dan kanal umpan balik (Discord, dll.)
Belum ada komentar.