- Claude 3.7 dan Grok 3 menunjukkan peningkatan besar dibanding AI sebelumnya dalam coding, penalaran matematis, dan kemampuan memecahkan masalah kompleks
- Claude 3.7 memiliki kemampuan coding dan penalaran logis yang baru, sementara Grok 3 adalah model pertama yang dilatih dengan daya komputasi lebih dari 10 kali GPT-4
- Claude tidak hanya menulis kode sederhana, tetapi juga menunjukkan kemampuan mengantisipasi kebutuhan pengguna, seperti menyediakan fitur tambahan yang tidak diminta
Perluasan komputasi model AI dan peningkatan performa
- Untuk meningkatkan performa AI, jumlah komputasi (FLOPs) harus ditingkatkan secara besar-besaran, dan secara umum kenaikan komputasi 10 kali lipat meningkatkan performa secara linear
- Grok 3 mencatat skor benchmark tertinggi di antara AI yang telah dipublikasikan sejauh ini, membuktikan bahwa Scaling Law komputasi AI masih tetap berlaku
- Model o3 yang belum dirilis dari OpenAI juga diperkirakan berada di tingkat yang mirip dengan Grok 3
Dua cara perluasan AI
- Pelatihan model melalui komputasi berskala besar
- Peningkatan komputasi menaikkan kecerdasan dasar AI
- Perluasan waktu penalaran (Reasoning)
- Jika lebih banyak daya komputasi digunakan saat menyelesaikan masalah, kualitas hasil meningkat
- Artinya, jika diberi lebih banyak waktu untuk berpikir, AI dapat menghasilkan jawaban yang lebih baik
- Model AI Gen3 generasi berikutnya menjadi lebih kuat dengan menggabungkan kedua teknik ini
Penurunan biaya AI dan peningkatan performa
- Saat GPT-4 dirilis, biaya per satu juta token adalah $50 → model Gemini 1.5 Flash saat ini adalah $0.12
- Kecerdasan model meningkat, sementara biayanya turun drastis, sehingga potensi pemanfaatannya makin besar bagi perusahaan maupun pengguna individu
Perubahan cara memanfaatkan AI
Pendekatan tradisional (berpusat pada otomasi) → peran baru AI (mitra cerdas)
- Perusahaan sebelumnya melihat AI sebagai alat otomasi tugas sederhana, tetapi AI baru kini mampu melakukan pekerjaan intelektual
- Contoh:
- Analisis makalah akademik dan verifikasi matematis
- Merangkum masalah kompleks dan menghasilkan ide baru
- Pembuatan otomatis visualisasi data interaktif 3D
→ Kini AI bukan lagi sekadar alat, melainkan dapat menjadi mitra yang membantu riset dan pemikiran kreatif
Saran untuk perusahaan dan para pemimpin
- Pahami AI bukan sebagai otomasi sederhana, tetapi sebagai alat untuk menciptakan kapabilitas baru
- Bukan bertanya "tugas apa yang bisa diotomatisasi?", melainkan "kemungkinan baru apa yang bisa dibuka?"
- Diperlukan pendekatan dinamis yang terus berubah, bukan strategi AI yang statis
- Teknologi AI berkembang sangat cepat, dan strategi all-in pada satu model itu berisiko
- Nilai AI sebaiknya diukur bukan hanya dari penghematan waktu, tetapi dari kemampuan pemecahan masalah yang inovatif
- Perlu mempertimbangkan potensi pertumbuhan jangka panjang, bukan hanya ROI jangka pendek
Claude 3.7 vs. Grok 3: AI mana yang sebaiknya dipilih?
- Claude 3.7
- Menyediakan fitur eksekusi kode
- Unggul dalam kemampuan percakapan dan memberi umpan balik yang natural
- Fitur perlindungan privasi diperkuat (data pengguna tidak digunakan untuk pelatihan).
- Grok 3
- Menawarkan lebih banyak fitur, unggul untuk deep research
- Bisa digunakan gratis, tetapi pemanfaatan kodenya sulit dan ada opsi penggunaan data pengguna untuk pelatihan
- xAI (perusahaan AI milik Elon Musk) berencana terus meningkatkan performanya
Rekomendasi penggunaan
- Coding atau pembuatan konten interaktif → Claude 3.7
- Riset mendalam dan pencarian informasi yang luas → Grok 3
Kesimpulan: ke mana masa depan AI?
- AI Gen3 (Claude 3.7, Grok 3, dll.) → kemungkinan kemunculan AI Gen4
- Peningkatan performa AI saat ini didorong oleh bertambahnya daya komputasi, dan ke depan performa diperkirakan akan terus membaik
- Baik perusahaan maupun individu harus cepat beradaptasi dengan perubahan cara memanfaatkan AI agar tetap kompetitif
1 komentar
Usulan untuk perusahaan dan para pemimpin terasa mengesankan. Mereka melihatnya bukan sekadar otomatisasi, melainkan sebagai alat untuk menciptakan kapabilitas baru dan bahkan mencari "bidang bisnis baru", haha