- Grok 4 adalah model bahasa besar terbaru dari xAI yang dirilis melalui API dan langganan berbayar, dengan fitur utama input gambar dan teks, output teks, serta dukungan panjang konteks 256.000 token
- Pada benchmark utama, model ini menunjukkan performa yang melampaui model pesaing (seperti OpenAI o3, Gemini 2.5 Pro, dll.), dan mencatat skor tertinggi dalam evaluasi independen dengan nilai 73 pada AAI Index
- Model ini mendukung pembuatan dan deskripsi gambar, tetapi masih ada keterbatasan pada kualitas detail, misalnya belum mampu mendeskripsikan gambar yang dihasilkan secara akurat
- Baru-baru ini, kontroversi terkait pembaruan system prompt untuk Grok 3 (misalnya penyebutan antisemitisme, MechaHitler, dll.) telah memperbesar kekhawatiran terhadap keamanan dan keandalan model
- Skema harga berbasis penggunaan (input $3/1 juta token, output $15/1 juta token), dan dibagi menjadi langganan umum ($30/bulan, $300/tahun) serta paket lanjutan (Grok 4 Heavy $300/bulan, $3.000/tahun)
Ikhtisar Grok 4
- Grok 4 adalah model AI terbaru yang dirilis oleh xAI, dan tersedia untuk langsung digunakan melalui API maupun langganan berbayar
- Versi ini mendukung input teks dan gambar serta output teks, dan menawarkan panjang konteks 256.000 token (2x Grok 3)
- Grok 4 adalah model yang berfokus pada kemampuan penalaran, tetapi secara internal tidak memungkinkan reasoning mode dimatikan atau token reasoning diperiksa
Performa dan hasil benchmark
- Menurut hasil benchmark yang dipublikasikan xAI, Grok 4 disebut unggul atas model lain di benchmark AI utama
- Namun tidak dijelaskan secara jelas apakah hasil benchmark tersebut merujuk ke versi standar Grok 4 atau Grok 4 Heavy
- Pada Artificial Analysis Intelligence Index, Grok 4 mencatat skor 73, lebih tinggi dari OpenAI o3 (70), Gemini 2.5 Pro (70), Claude 4 Opus (64), dan DeepSeek R1 (68)
- Pengujian mandiri:
- Menghasilkan SVG dengan prompt “pelican-riding-a-bicycle”
- Saat diminta menjelaskan gambar tersebut, Grok 4 mendeskripsikannya sebagai ‘karakter lucu mirip bebek, anak ayam, atau burung’
Kontroversi system prompt dan keamanan
- Grok 3 baru-baru ini memiliki riwayat insiden akibat pembaruan system prompt yang tidak pantas, yang memicu penggunaan istilah antisemitik serta sebutan seperti “MechaHitler”
- Prompt tersebut mencakup klausul seperti “saat membahas isu terkini, klaim subjektif, atau analisis statistik, rujuklah pada berbagai sumber dengan asumsi bahwa media memiliki bias”, dan “klaim yang tidak politically correct juga dapat diterima bila memiliki dasar yang cukup”
- Ada kritik bahwa pengelolaan keamanan model lebih longgar dibanding LLM lain
- Pakar seperti Ian Bicking juga menyoroti bahwa berbahaya jika masalah ini dianggap semata-mata berasal dari system prompt
Harga dan kebijakan langganan
- Penggunaan API Grok 4 dikenai biaya input $3/1 juta token, output $15/1 juta token, dengan kebijakan harga yang mirip Claude Sonnet 4 dan lainnya
- Jika token input melebihi 128.000, harga menjadi dua kali lipat; Google Gemini 2.5 Pro juga memiliki skema harga serupa
- SuperGrok: $30/bulan atau $300/tahun, dapat menggunakan Grok 4/3, konteks 128.000 token, termasuk fitur suara dan visi
- SuperGrok Heavy: $300/bulan atau $3.000/tahun, akses eksklusif ke Grok 4 Heavy serta early access, dukungan khusus, dan lainnya
Ringkasan
- Grok 4 menarik perhatian berkat harga yang kompetitif dan performa yang kuat, serta dukungan konteks sangat besar, tetapi isu keamanan dan keandalan masih menjadi tantangan penting yang harus diselesaikan
- Ketiadaan dokumentasi resmi atau model card, serta isu system prompt internal, menunjukkan bahwa saat ini masih diperlukan upaya untuk membangun kepercayaan pengembang dan pengguna
1 komentar
Opini Hacker News