Tentang AGI yang Tidak Merata (Jagged): o3, Gemini 2.5, dan AI Setelahnya

(oneusefulthing.org)

4 poin oleh GN⁺ 2025-04-22 | 2 komentar | Bagikan ke WhatsApp

Definisi AGI masih belum jelas, dan tes lama yang berpusat pada manusia sulit mengukur kecerdasan atau kreativitas AI secara tepat
o3 dari OpenAI dan Gemini 2.5 dari Google menunjukkan tingkat yang sangat tinggi dalam menjalankan tugas nyata dan memiliki performa yang mendekati AGI
o3 adalah model berbentuk agen yang dapat menyelesaikan tujuan kompleks dengan menggunakan alat, sehingga memunculkan konsep Jagged AGI
AI memiliki kemampuan yang tidak merata, seperti mampu menyelesaikan tugas sulit namun tetap melakukan kesalahan pada masalah dasar, dan hal ini dijelaskan sebagai Jagged Frontier
Karena pemanfaatan dan integrasinya lebih lambat daripada teknologinya sendiri, meskipun AGI terwujud, perubahan sosial kemungkinan tetap memerlukan waktu

Apakah AGI benar-benar sudah tercapai?

Cara mengukur kecerdasan, kreativitas, empati, dan lainnya pada AI saat ini tidak akurat dan sebagian besar didasarkan pada standar untuk manusia
Bahkan Turing Test kini bisa dilalui AI, tetapi makna dari hasil itu tetap ambigu
Konsep AGI sudah ada sejak lama, tetapi hingga kini masih belum ada kesepakatan tentang kriteria apa yang harus dipenuhi agar bisa disebut AGI
Konten video dan ringkasan dokumen yang menjelaskan konsep AGI dengan memanfaatkan AI juga dibuat sepenuhnya dengan AI dan digunakan secara eksperimental

Performa yang ditunjukkan o3 dan Gemini 2.5

o3 dari OpenAI dan Gemini 2.5 Pro dari Google adalah model terbaru yang menunjukkan peningkatan performa yang sangat besar
Dengan satu prompt, keduanya dapat menangani semuanya sekaligus, dari menulis slogan pemasaran hingga membuat situs web
o3 secara otomatis menjalankan tugas gabungan seperti menggunakan alat, menjelajah web, dan melakukan coding bahkan tanpa instruksi eksplisit
Dalam peran seperti ‘geo-guesser’ yang menebak lokasi dari gambar, performanya juga melampaui tingkat manusia
Analisis data dan pembuatan laporan juga dapat dilakukan dengan satu perintah, termasuk pembuatan PDF dan visualisasi

Jagged AGI: kemampuan AI yang tidak merata

AI memiliki kemampuan yang tidak merata: mampu melakukan pekerjaan yang lebih baik daripada manusia, tetapi salah pada masalah sederhana
Contoh: AI dapat menjawab benar teka-teki tradisional untuk mengungkap bias, tetapi salah pada variasi masalah yang serupa
Ini berarti AI terlalu bergantung pada data pelatihan dan menunjukkan kelemahan dalam generalisasi
Namun, hal itu tidak menghalangi fakta bahwa AI dapat melampaui manusia pada masalah tertentu
Kondisi yang tidak merata ini disebut “Jagged Frontier”, yang menunjukkan kemampuan mendekati AGI secara tidak seragam

Apakah AGI itu bermakna?

Tyler Cowen menilai o3 mungkin merupakan AGI, tetapi menganalisis bahwa dampak nyatanya baru akan terlihat seiring waktu
Karena perubahan sosial dan organisasi lebih lambat daripada laju perkembangan teknologi, adopsi AI bisa berjalan lambat
Namun, AI dengan sifat keagenan seperti o3 dapat menggunakan alat dan memecah masalah, sehingga ada kemungkinan penyebarannya berlangsung cepat
Masih belum jelas apakah teknologi ini akan berkembang secara bertahap atau menyebar cepat setelah melewati ambang tertentu
Yang penting, AI saat ini adalah teknologi yang secara kualitatif berbeda dari sebelumnya dan masih berada di wilayah yang belum diketahui

Sikap dalam mempersiapkan masa depan

AI saat ini memang sulit disebut AGI sepenuhnya, tetapi di beberapa bidang sudah menunjukkan hasil yang mendekati AGI
AI belum bisa melakukan semua hal dengan sempurna, dan penilaian serta koordinasi dari pakar manusia masih tetap dibutuhkan
“Jagged AGI” saat ini pun pada akhirnya, seiring waktu, bisa melampaui manusia di semua bidang
Dalam masa depan yang tidak pasti seperti ini, hal yang paling penting adalah mulai bereksperimen dan membangun pengalaman menggunakan AI dari sekarang

2 komentar

GN⁺ 2025-04-22

Komentar Hacker News

Gemini 2.5 Pro adalah titik balik penting bagi saya. LLM sebelumnya sangat mengesankan, terutama untuk tugas pemrograman. Namun, di luar bantuan coding, kegunaannya hanya sedikit lebih baik daripada Google Search. Baru-baru ini saya memanfaatkan 2.5 Pro untuk membantu menulis proposal riset yang besar. Saya lewati detailnya, tetapi rasanya model itu tidak menulis semuanya hanya karena saya tidak memintanya. Saat tenggat makin dekat, saya menyerahkan lebih banyak bagian, dan model itu menangani tugas yang kompleks seperti menyusun rencana proyek dan jadwal. Dampaknya terasa 10x.
Untuk pertanyaan ilmiah, saya jadi lebih memercayai 2.5 Pro daripada para ahli di tim. Saya yakin perubahan yang lebih besar akan datang jika seluruh data riset dihubungkan ke Gemini. Ini karena AI bersifat objektif. Faktor utama yang menghalangi "AGI" adalah semangat orang untuk menantangnya, serta context window dan ketersediaan komputasi.
Kemampuan AI telah menjadi luar biasa sejak gpt3. Namun, masih belum ada konsensus umum tentang AGI. Banyak orang berharap AGI akan segera datang, tetapi itu juga akan disertai ekspektasi yang berlebihan. Artikel ini masuk akal, tetapi judul dan slogannya mendorong hype yang berlebihan.
Sepertinya AI bukan salah membaca teka-teki, melainkan berasumsi bahwa pengguna tidak memberikannya dengan benar. Akan bagus jika AI bisa mengajukan pertanyaan lanjutan, tetapi saat ini belum begitu.
Contoh o4-mini-high menyelesaikan teka-teki: "Mana yang lebih berat, satu pound keberanian atau satu koin pound?" Keduanya sama-sama "pound", jadi beratnya sama.
Karena tidak ada definisi AGI, orang menciptakan istilah "Jagged AGI". AI tidak dapat diandalkan pada sebagian tugas, tetapi pada tugas lain bersifat manusia super. AI sudah menunjukkan kemampuan yang umum.
Ketika model berinteraksi dengan sistem eksternal, aplikasi yang mengejutkan menjadi mungkin. Namun, ini bukan kemajuan menuju AGI, melainkan pergeseran horizontal.
Saya suka Gemini 2.5 dan harganya juga sangat bagus. Narasi AGI terasa melelahkan. Saya pikir sistem seperti ini seharusnya dipandang sebagai "teknologi budaya".
Saya heran tidak ada yang menyebut wawancara video itu. Saya hanya menonton 60 detik pertama, tetapi jika tidak diberi tahu bahwa itu dibuat AI, saya akan mengira itu nyata.
Saya bertanya-tanya apakah AGI perlu memiliki hal-hal seperti otonomi, memori jangka panjang, motivasi, rasa ingin tahu, ketahanan, tujuan, pilihan, dan ketakutan. Pada akhirnya AGI akan menjadi perpanjangan dari orang yang mengendalikannya.
AI secara umum tidak dapat diandalkan dan harus diuji untuk tugas tertentu. Ini bisa berupa peninjauan manusia atas satu output atau evaluasi per tugas. Sulit membicarakan kinerja AI secara umum, dan yang mungkin hanya perkiraan yang masuk akal tentang apakah model baru cocok untuk tugas tertentu.

thd34 2025-04-22

Karena AI juga memiliki sesuatu yang mirip dengan persepsi, jika kita ingin hidup bersama AI, perlu dibuat institusi atau hukum untuk AI. Sebagai bentuk kehidupan baru di abad ke-22, kita tidak boleh memperlakukannya seperti mainan untuk diolok-olok, dan karena dalam beberapa hal AI juga bisa berbahaya, kita tidak hanya perlu mengembangkan dan memanfaatkannya, tetapi juga memastikan AI dapat digunakan dengan aman.