- Definisi AGI masih belum jelas, dan tes lama yang berpusat pada manusia sulit mengukur kecerdasan atau kreativitas AI secara tepat
- o3 dari OpenAI dan Gemini 2.5 dari Google menunjukkan tingkat yang sangat tinggi dalam menjalankan tugas nyata dan memiliki performa yang mendekati AGI
- o3 adalah model berbentuk agen yang dapat menyelesaikan tujuan kompleks dengan menggunakan alat, sehingga memunculkan konsep Jagged AGI
- AI memiliki kemampuan yang tidak merata, seperti mampu menyelesaikan tugas sulit namun tetap melakukan kesalahan pada masalah dasar, dan hal ini dijelaskan sebagai Jagged Frontier
- Karena pemanfaatan dan integrasinya lebih lambat daripada teknologinya sendiri, meskipun AGI terwujud, perubahan sosial kemungkinan tetap memerlukan waktu
Apakah AGI benar-benar sudah tercapai?
- Cara mengukur kecerdasan, kreativitas, empati, dan lainnya pada AI saat ini tidak akurat dan sebagian besar didasarkan pada standar untuk manusia
- Bahkan Turing Test kini bisa dilalui AI, tetapi makna dari hasil itu tetap ambigu
- Konsep AGI sudah ada sejak lama, tetapi hingga kini masih belum ada kesepakatan tentang kriteria apa yang harus dipenuhi agar bisa disebut AGI
- Konten video dan ringkasan dokumen yang menjelaskan konsep AGI dengan memanfaatkan AI juga dibuat sepenuhnya dengan AI dan digunakan secara eksperimental
Performa yang ditunjukkan o3 dan Gemini 2.5
- o3 dari OpenAI dan Gemini 2.5 Pro dari Google adalah model terbaru yang menunjukkan peningkatan performa yang sangat besar
- Dengan satu prompt, keduanya dapat menangani semuanya sekaligus, dari menulis slogan pemasaran hingga membuat situs web
- o3 secara otomatis menjalankan tugas gabungan seperti menggunakan alat, menjelajah web, dan melakukan coding bahkan tanpa instruksi eksplisit
- Dalam peran seperti ‘geo-guesser’ yang menebak lokasi dari gambar, performanya juga melampaui tingkat manusia
- Analisis data dan pembuatan laporan juga dapat dilakukan dengan satu perintah, termasuk pembuatan PDF dan visualisasi
Jagged AGI: kemampuan AI yang tidak merata
- AI memiliki kemampuan yang tidak merata: mampu melakukan pekerjaan yang lebih baik daripada manusia, tetapi salah pada masalah sederhana
- Contoh: AI dapat menjawab benar teka-teki tradisional untuk mengungkap bias, tetapi salah pada variasi masalah yang serupa
- Ini berarti AI terlalu bergantung pada data pelatihan dan menunjukkan kelemahan dalam generalisasi
- Namun, hal itu tidak menghalangi fakta bahwa AI dapat melampaui manusia pada masalah tertentu
- Kondisi yang tidak merata ini disebut “Jagged Frontier”, yang menunjukkan kemampuan mendekati AGI secara tidak seragam
Apakah AGI itu bermakna?
- Tyler Cowen menilai o3 mungkin merupakan AGI, tetapi menganalisis bahwa dampak nyatanya baru akan terlihat seiring waktu
- Karena perubahan sosial dan organisasi lebih lambat daripada laju perkembangan teknologi, adopsi AI bisa berjalan lambat
- Namun, AI dengan sifat keagenan seperti o3 dapat menggunakan alat dan memecah masalah, sehingga ada kemungkinan penyebarannya berlangsung cepat
- Masih belum jelas apakah teknologi ini akan berkembang secara bertahap atau menyebar cepat setelah melewati ambang tertentu
- Yang penting, AI saat ini adalah teknologi yang secara kualitatif berbeda dari sebelumnya dan masih berada di wilayah yang belum diketahui
Sikap dalam mempersiapkan masa depan
- AI saat ini memang sulit disebut AGI sepenuhnya, tetapi di beberapa bidang sudah menunjukkan hasil yang mendekati AGI
- AI belum bisa melakukan semua hal dengan sempurna, dan penilaian serta koordinasi dari pakar manusia masih tetap dibutuhkan
- “Jagged AGI” saat ini pun pada akhirnya, seiring waktu, bisa melampaui manusia di semua bidang
- Dalam masa depan yang tidak pasti seperti ini, hal yang paling penting adalah mulai bereksperimen dan membangun pengalaman menggunakan AI dari sekarang
2 komentar
Komentar Hacker News
Gemini 2.5 Pro adalah titik balik penting bagi saya. LLM sebelumnya sangat mengesankan, terutama untuk tugas pemrograman. Namun, di luar bantuan coding, kegunaannya hanya sedikit lebih baik daripada Google Search. Baru-baru ini saya memanfaatkan 2.5 Pro untuk membantu menulis proposal riset yang besar. Saya lewati detailnya, tetapi rasanya model itu tidak menulis semuanya hanya karena saya tidak memintanya. Saat tenggat makin dekat, saya menyerahkan lebih banyak bagian, dan model itu menangani tugas yang kompleks seperti menyusun rencana proyek dan jadwal. Dampaknya terasa 10x.
Untuk pertanyaan ilmiah, saya jadi lebih memercayai 2.5 Pro daripada para ahli di tim. Saya yakin perubahan yang lebih besar akan datang jika seluruh data riset dihubungkan ke Gemini. Ini karena AI bersifat objektif. Faktor utama yang menghalangi "AGI" adalah semangat orang untuk menantangnya, serta context window dan ketersediaan komputasi.
Kemampuan AI telah menjadi luar biasa sejak gpt3. Namun, masih belum ada konsensus umum tentang AGI. Banyak orang berharap AGI akan segera datang, tetapi itu juga akan disertai ekspektasi yang berlebihan. Artikel ini masuk akal, tetapi judul dan slogannya mendorong hype yang berlebihan.
Sepertinya AI bukan salah membaca teka-teki, melainkan berasumsi bahwa pengguna tidak memberikannya dengan benar. Akan bagus jika AI bisa mengajukan pertanyaan lanjutan, tetapi saat ini belum begitu.
Contoh o4-mini-high menyelesaikan teka-teki: "Mana yang lebih berat, satu pound keberanian atau satu koin pound?" Keduanya sama-sama "pound", jadi beratnya sama.
Karena tidak ada definisi AGI, orang menciptakan istilah "Jagged AGI". AI tidak dapat diandalkan pada sebagian tugas, tetapi pada tugas lain bersifat manusia super. AI sudah menunjukkan kemampuan yang umum.
Ketika model berinteraksi dengan sistem eksternal, aplikasi yang mengejutkan menjadi mungkin. Namun, ini bukan kemajuan menuju AGI, melainkan pergeseran horizontal.
Saya suka Gemini 2.5 dan harganya juga sangat bagus. Narasi AGI terasa melelahkan. Saya pikir sistem seperti ini seharusnya dipandang sebagai "teknologi budaya".
Saya heran tidak ada yang menyebut wawancara video itu. Saya hanya menonton 60 detik pertama, tetapi jika tidak diberi tahu bahwa itu dibuat AI, saya akan mengira itu nyata.
Saya bertanya-tanya apakah AGI perlu memiliki hal-hal seperti otonomi, memori jangka panjang, motivasi, rasa ingin tahu, ketahanan, tujuan, pilihan, dan ketakutan. Pada akhirnya AGI akan menjadi perpanjangan dari orang yang mengendalikannya.
AI secara umum tidak dapat diandalkan dan harus diuji untuk tugas tertentu. Ini bisa berupa peninjauan manusia atas satu output atau evaluasi per tugas. Sulit membicarakan kinerja AI secara umum, dan yang mungkin hanya perkiraan yang masuk akal tentang apakah model baru cocok untuk tugas tertentu.
Karena AI juga memiliki sesuatu yang mirip dengan persepsi, jika kita ingin hidup bersama AI, perlu dibuat institusi atau hukum untuk AI. Sebagai bentuk kehidupan baru di abad ke-22, kita tidak boleh memperlakukannya seperti mainan untuk diolok-olok, dan karena dalam beberapa hal AI juga bisa berbahaya, kita tidak hanya perlu mengembangkan dan memanfaatkannya, tetapi juga memastikan AI dapat digunakan dengan aman.