- Model Grok-2 dan Grok-2 mini dirilis untuk pengguna Grok di platform X
- Grok-2 memiliki kemampuan chat, coding, dan penalaran yang berkembang pesat dibanding model sebelumnya, Grok-1.5
- Versi awal Grok-2 yang diuji di leaderboard LMSYS dengan nama
sus-column-r menunjukkan performa yang lebih unggul daripada Claude 3.5 Sonnet dan GPT-4-Turbo
Model bahasa dan fitur chat Grok-2
- Versi awal Grok-2 dikirim ke LMSYS Chatbot Arena (alat benchmark kompetisi LLM yang terkenal) dengan nama sus-column-r
- Dalam hal skor Elo keseluruhan model, Grok-2 melampaui Claude dan GPT-4
Benchmark
- Model Grok-2 dievaluasi pada serangkaian benchmark akademik seperti penalaran, pemahaman bacaan, matematika, sains, dan coding
- Grok-2 dan Grok-2 mini menunjukkan peningkatan yang signifikan dibanding model Grok-1.5 sebelumnya
- Di bidang seperti pengetahuan sains tingkat pascasarjana (GPQA), pengetahuan umum (MMLU, MMLU-Pro), dan soal olimpiade matematika (MATH), model ini mencapai performa yang kompetitif dengan model mutakhir lainnya
- Grok-2 menunjukkan performa mutakhir dalam penalaran matematika visual (MathVista) dan tanya jawab berbasis dokumen (DocVQA)
Menjajal Grok dengan informasi real-time di X
- Grok telah terus ditingkatkan di platform X
- Pengguna X Premium dan Premium+ dapat mengakses dua model baru, yaitu Grok-2 dan Grok-2 mini
- Grok-2 dapat diakses melalui tab Grok di aplikasi X, dan merupakan asisten AI mutakhir dengan kemampuan lanjutan baik dalam teks maupun pemahaman visual
- Grok-2 mini adalah model yang lebih kecil tetapi mumpuni, yang menawarkan keseimbangan antara kecepatan dan kualitas jawaban
- Bekerja sama dengan Black Forest Labs untuk bereksperimen dengan model FLUX.1 dan memperluas kemampuan Grok di X
Membangun dengan Grok menggunakan Enterprise API
- Pada akhir bulan ini, Grok-2 dan Grok-2 mini akan dirilis untuk developer melalui platform Enterprise API yang baru
- API baru ini dibangun di atas tech stack kustom baru yang memungkinkan deployment inferensi multiwilayah dengan akses latensi rendah di seluruh dunia
- Menyediakan fitur keamanan yang ditingkatkan seperti autentikasi multifaktor wajib, statistik traffic yang kaya, dan analitik penagihan tingkat lanjut
- Menyediakan API administrasi yang dapat mengintegrasikan manajemen tim, pengguna, dan penagihan ke alat serta layanan internal yang sudah ada
What is Next?
- Grok-2 dan Grok-2 mini sedang diluncurkan di X
- Sangat menantikan berbagai fitur berbasis AI seperti kemampuan pencarian yang ditingkatkan oleh Grok, insight mendalam terhadap postingan X, dan fitur balasan yang telah diperbaiki
- Segera akan merilis preview pemahaman multimodal sebagai bagian inti dari pengalaman Grok di X dan API
- Sejak pengumuman Grok-1 pada November 2023, X.AI bergerak dengan kecepatan luar biasa dipimpin oleh tim kecil dengan kepadatan talenta tertinggi
- Dengan memperkenalkan Grok-2, X.AI berada di garis depan pengembangan AI
- Berfokus untuk memajukan kemampuan penalaran inti dengan cluster komputasi baru
- Dalam beberapa bulan ke depan akan membagikan jauh lebih banyak perkembangan
- "Sedang mencari individu yang ingin bergabung dengan tim kecil dan fokus yang berdedikasi membangun inovasi paling berdampak bagi masa depan umat manusia"
Belum ada komentar.