10 poin oleh xguru 2025-02-19 | 1 komentar | Bagikan ke WhatsApp
  • Misi xAI adalah memahami hakikat alam semesta, dan untuk itu mereka mengembangkan Grok, AI yang menempatkan pencarian kebenaran sebagai prioritas utama
  • Grok 3 menunjukkan performa lebih dari 10 kali lebih baik dibanding Grok 2, berkat upaya tim yang luar biasa dan sumber daya komputasi skala besar
    • Grok adalah kata yang digunakan oleh tokoh yang dibesarkan di Mars dalam novel Heinlein Stranger in a Strange Land, yang berarti "memahami sesuatu secara utuh dan mendalam"
    • Empati juga berperan sebagai elemen penting
  • xAI memulai model pertamanya 17 bulan lalu, dan Grok 1 adalah model dengan 314B (314 miliar) parameter
    • Setelah itu berlanjut ke Grok 1.5, Grok 2, lalu pengembangan Grok 3, dengan peningkatan performa yang sangat besar
  • Pusat data: xAI membangun pusat datanya sendiri untuk mempercepat pengembangan Grok
    • Dibutuhkan 122 hari untuk mengoperasikan klaster GPU 100 ribu pertama, lalu dalam 92 hari kapasitasnya digandakan menjadi 200K
    • Ini adalah klaster H100 fully connected terbesar di dunia, dan seluruh GPU serta daya komputasi ini telah digunakan untuk meningkatkan Grok
  • Grok 3: performanya meningkat lebih dari 10 kali dibanding Grok 2 (sebenarnya lebih dari 15 kali)
    • Pre-training selesai pada awal Januari, dan saat ini masih terus dilatih
  • Benchmark: Grok 3 menunjukkan performa unggul dalam penalaran matematika umum, sains, dan coding
    • Versi kecilnya, Grok 3 Mini, juga setara dengan para pesaing
    • Secara khusus, ia mencatat hasil terbaik pada soal kompetisi matematika tingkat SMA (AIME)
    • Di evaluasi chatbot terbaru (Chatbot Arena), model ini mencatat skor ELO di atas 1.400 dan menempati peringkat pertama di antara semua model

Fitur baru di Grok 3

  • Advanced Reasoning
    • Grok 3 tidak hanya memberikan jawaban sederhana, tetapi memiliki kemampuan menemukan jawaban melalui proses berpikir yang mendalam
    • Kemampuannya dalam menganalisis masalah, menemukan kesalahan, dan menjelajahi berbagai kemungkinan diperkuat
    • Contoh nyata:
      • Perhitungan lintasan perjalanan ke Mars: mensimulasikan lintasan pulang-pergi Bumi-Mars dan menampilkannya secara visual
      • Pengembangan game baru: langsung menghasilkan game baru yang menggabungkan Tetris dan Zuma
  • Kemampuan pembelajaran real-time Grok 3
    • Perbaikan baru terjadi setiap hari, dan perbedaan performa bisa terlihat hanya dalam selang satu hari
    • Model terus berkembang bahkan selama proses pengujian
  • Peningkatan engineering dengan memanfaatkan Grok 3
    • Secara internal, Grok 3 juga memangkas ratusan jam kerja dalam coding dan pemecahan masalah
    • Melalui penyelesaian soal matematika dan competitive programming, model ini belajar mendeteksi dan memperbaiki kesalahannya sendiri

Fitur generasi berikutnya: agen berbasis Grok 3

  • Deep Search
    • Mesin pencari AI baru yang menemukan informasi lebih mendalam dibanding mesin pencari biasa
    • Menganalisis informasi dari banyak situs dan membandingkan informasi terbaru untuk memberikan jawaban yang paling dapat dipercaya
    • Contoh:
      • Mencari jadwal peluncuran Starship berikutnya
      • Menganalisis build populer Path of Exile
      • Prediksi pemenang turnamen basket March Madness
  • Asisten suara AI (Voice Assistant)
    • Akan ditambahkan fitur yang memungkinkan pengguna berkomunikasi dengan Grok seperti benar-benar sedang bercakap-cakap
    • Grok tidak hanya mengubah teks, tetapi juga dapat bercakap secara alami dengan mempertimbangkan nada suara, emosi, dan intonasi

Peluncuran Grok 3 dan rencana ke depan

  • Jadwal peluncuran
    • Mulai hari ini, versi beta Grok 3 tersedia untuk pelanggan Premium+
    • Fitur baru dapat digunakan setelah memperbarui aplikasi X (dulu Twitter)
    • Peluncuran situs web mandiri grok.com dan aplikasi Grok khusus (iOS/Android)
  • Opsi langganan baru: Super Grok
    • Diluncurkan model langganan Super Grok untuk pengguna yang ingin lebih cepat mencoba fitur-fitur terbaru
  • Rencana ke depan
    • API Grok 3 akan dirilis (dalam beberapa minggu)
    • Grok 3 akan dibuka sebagai open source (dalam beberapa bulan ke depan)
    • Sedang membangun klaster generasi berikutnya yang lebih kuat (5 kali performa yang ada saat ini)
    • Berencana mendirikan studio game AI untuk mempercepat pengembangan game berbasis AI

Kesimpulan

  • Grok 3 membuka dimensi baru bagi model AI, dan xAI sedang berupaya untuk terus mengembangkannya
  • Dengan kemampuan penalaran yang kuat, mesin pencari berbasis AI, dan fitur asisten suara, Grok berkembang semakin dekat menjadi asisten AI sejati
  • Elon Musk memperkirakan bahwa di masa depan AI akan mencapai prestasi akademik seperti Fields Medal (Nobel-nya dunia matematika)

1 komentar

 
GN⁺ 2025-02-19
Opini Hacker News
  • Karpathy menggambarkan kesan awalnya terhadap Grok setara dengan OpenAI o1-pro
  • Grok telah mencapai tingkat teratas pada salah satu benchmark
  • Persaingan di bidang LLM semakin ketat, dan ini kabar baik bagi konsumen
    • Semoga perusahaan yang monopolistik tidak menyerap seluruh nilainya
  • Ada bukti bahwa LLM mutakhir bisa dibangun dengan biaya yang lebih rendah
  • Rekaman presentasinya kurang menginspirasi
    • Tidak ada hal baru, hanya hal-hal yang sudah diketahui
  • Banyak orang merasa mereka sedang meniru OpenAI
    • OpenAI masih dianggap menunjukkan apa yang masih bisa dilakukan
  • Harus diakui bahwa xAI berhasil mengejar dengan cepat
    • Bukan hanya pada model, tetapi juga unggul pada produk
  • Hasil terbaik Grok yang kompetitif mungkin adalah mematahkan persepsi publik terhadap ChatGPT
  • Karpathy percaya ini berada di level o1-pro
  • OpenAI sekali lagi membuktikan bahwa tidak ada moat teknis
    • Tawaran Elon untuk mengakuisisi OpenAI dianggap masuk akal
  • Elon populer di Tiongkok, sehingga bisa lebih mudah merekrut engineer AI
    • Bisa menawarkan saham xAI/XSpace/Neurallink
  • Semoga beruntung bagi para investor yang menilai OpenAI di atas 100 miliar dolar AS
  • Ada rencana untuk merilis bobot Grok 2
  • Membayangkan masa depan saat LLM menyisipkan iklan yang dipersonalisasi