7 poin oleh GN⁺ 2025-10-27 | Belum ada komentar. | Bagikan ke WhatsApp
  • Dalam riset kecerdasan buatan, ketiadaan definisi yang jelas untuk AGI (Artificial General Intelligence) membuat jarak antara kognisi setara manusia dan AI saat ini menjadi kabur
  • Makalah ini mengajukan kerangka kerja yang dapat dikuantifikasi, dengan mendefinisikan AGI sebagai ‘AI yang memiliki keragaman dan kemahiran kognitif setara orang dewasa berpendidikan baik’
  • Berdasarkan teori Cattell-Horn-Carroll (CHC), model representatif dalam studi kognisi manusia, kecerdasan umum manusia diuraikan menjadi 10 domain kognitif inti lalu diterapkan untuk evaluasi AI
  • Melalui kerangka ini, profil kognitif GPT-4 dan GPT-5 dikuantifikasi; GPT-4 mencatat skor AGI 27%, sedangkan GPT-5 57%
  • Ini menunjukkan kemajuan AI yang pesat, namun juga mengisyaratkan bahwa masih ada kesenjangan besar menuju AGI karena kekurangan kemampuan kognitif fundamental seperti penyimpanan memori jangka panjang

Kebutuhan akan definisi AGI dan pengenalan masalah

  • AGI (Artificial General Intelligence) dinilai sebagai salah satu kemajuan teknologi terpenting dalam sejarah manusia, tetapi definisinya yang kabur memicu perdebatan
    • Seiring AI secara bertahap menaklukkan bidang-bidang seperti matematika dan seni yang dulu dianggap memerlukan kecerdasan manusia, standar tentang ‘AGI’ terus bergeser
    • Akibatnya, diskusi tentang kapan AGI akan tercapai atau pada tingkat apa menjadi tidak produktif, dan kesenjangan nyata antara AI saat ini dan AGI tertutupi
  • Makalah ini mengusulkan kerangka kerja kuantitatif dan sistematis untuk menghilangkan ambiguitas tersebut
    • Definisi yang diusulkan: “AGI adalah AI yang memiliki keragaman dan kemahiran kognitif setara orang dewasa berpendidikan baik”
    • Ini merujuk pada kecerdasan yang memiliki keluasan kognitif (versatility) dan kedalaman/kemahiran (proficiency), bukan sekadar kemampuan menyelesaikan satu tugas

Pendekatan berbasis model kognisi manusia

  • Untuk mewujudkan definisi AGI secara praktis, struktur kognisi manusia dijadikan model
    • Kecerdasan umum manusia bukanlah satu kemampuan tunggal, melainkan kompleks berbagai kemampuan kognitif yang dibentuk oleh evolusi
    • Kemampuan-kemampuan inilah yang memungkinkan daya adaptasi dan pemahaman manusia terhadap dunia
  • Penelitian ini didasarkan pada teori Cattell-Horn-Carroll (CHC)
    • Teori CHC adalah model kecerdasan manusia yang paling tervalidasi secara empiris, karena mensintesis analisis faktor dari tes kemampuan kognitif yang terakumulasi selama lebih dari 100 tahun
    • Sejak era 1990–2000-an, sebagian besar tes kecerdasan klinis dirancang berdasarkan model CHC
    • CHC mengklasifikasikan kecerdasan manusia secara hierarkis menjadi kemampuan tingkat atas (luas) dan kemampuan tingkat bawah (rinci)
    • Contoh: penalaran induktif, memori asosiatif, penelusuran spasial

Perancangan kerangka evaluasi untuk AI

  • Sistem pengujian psikometrik yang telah berkembang selama puluhan tahun dimodifikasi agar sesuai untuk evaluasi AI
    • Sementara evaluasi AI yang ada bergantung pada kinerja tugas yang digeneralisasi, penelitian ini secara langsung memverifikasi apakah AI memiliki kemampuan kognitif rinci dalam CHC
    • Dengan menerapkan tes berbentuk sama seperti tes kognitif untuk manusia kepada AI, penelitian ini mengukur keragaman dan kemahiran kognitif
  • Hasil dinyatakan sebagai skor AGI terstandarisasi (0–100%), dengan 100% berarti AGI sepenuhnya tercapai
    • GPT-4 dinilai 27% dan GPT-5 57%, yang menunjukkan kemajuan cepat sekaligus masih adanya kesenjangan besar
  • Hasil eksperimen menunjukkan bahwa AI unggul pada benchmark kompleks, tetapi pada tugas kognitif dasar yang sederhana bagi manusia, AI hanya mampu menyelesaikan sekitar setengahnya
    • Ini berarti AI saat ini mungkin sangat unggul di area tertentu, tetapi struktur kecerdasannya lebih sempit daripada manusia dalam keluasan kognitif secara keseluruhan

10 komponen kognitif inti

  • Berdasarkan kemampuan luas dalam CHC, kerangka ini mendefinisikan 10 domain kognitif inti dan memberi bobot yang sama pada tiap domain (10%)
    • Pengetahuan umum (General Knowledge, K): keluasan pemahaman faktual tentang dunia, termasuk pengetahuan umum, budaya, sains, ilmu sosial, sejarah, dan lainnya
    • Kemampuan membaca dan menulis (Reading & Writing, RW): kemampuan memproses teks seperti dekode bahasa, pemahaman, penulisan, dan penggunaan gaya bahasa
    • Kemampuan matematika (Mathematical Ability, M): pengetahuan matematika dan kemampuan pemecahan masalah, termasuk aritmetika, aljabar, geometri, probabilitas, dan kalkulus
    • Penalaran spontan (On-the-Spot Reasoning, R): kemampuan kontrol atensi yang fleksibel untuk memecahkan masalah baru tanpa bergantung pada pengetahuan yang sudah ada
    • Memori kerja (Working Memory, WM): kemampuan mempertahankan dan memanipulasi informasi teks, auditori, dan visual secara simultan
    • Penyimpanan memori jangka panjang (Long-Term Memory Storage, MS): kemampuan untuk terus mempelajari dan menyimpan informasi baru
    • Pengambilan memori jangka panjang (Long-Term Memory Retrieval, MR): kemampuan memanggil kembali pengetahuan yang tersimpan secara akurat dan menghindari halusinasi (confabulation)
    • Pemrosesan visual (Visual Processing, V): kemampuan mengenali, menganalisis, menghasilkan, dan menelusuri informasi visual
    • Pemrosesan auditori (Auditory Processing, A): kemampuan membedakan, mengenali, dan memanfaatkan secara kreatif stimulus auditori seperti suara, ritme, dan musik
    • Kecepatan (Speed, S): kemampuan menjalankan tugas kognitif sederhana dengan cepat, termasuk kecepatan persepsi, waktu reaksi, dan kelancaran pemrosesan
  • Melalui 10 domain ini, dimungkinkan evaluasi multimodal yang mencakup teks, visual, dan auditori, serta diagnosis yang presisi atas kekuatan dan kelemahan AI

Profil kognitif AI saat ini dan implikasinya

  • Hasil perbandingan kemampuan kognitif GPT-4 dan GPT-5 menunjukkan bahwa mereka unggul pada domain berbasis pengetahuan, tetapi sangat kurang pada domain terkait memori
    • Secara khusus, kemampuan penyimpanan memori jangka panjang ditunjukkan sebagai kekurangan terbesar
    • Ini memperlihatkan belum adanya struktur kognitif dasar yang dibutuhkan AI saat ini untuk mencapai kecerdasan umum setara manusia
  • Kerangka ini dapat digunakan sebagai alat pelacakan kuantitatif atas perkembangan AI
    • Melalui skor AGI, laju kemajuan antar model dan kesenjangan yang tersisa dapat dikuantifikasi dengan jelas
    • Ke depan, ini dapat berfungsi sebagai indikator yang menekankan pentingnya perkembangan kognitif yang seimbang dalam riset AI

Kesimpulan

  • Penelitian ini menghilangkan ambiguitas dalam diskusi AGI dan mengajukan definisi kuantitatif berbasis model kognisi manusia
  • Melalui evaluasi 10 domain kognitif berdasarkan teori CHC, keluasan dan kedalaman kognitif AI dapat diukur secara objektif
  • Hasil GPT-4 dan GPT-5 menunjukkan bahwa AI berkembang pesat, tetapi masih sangat berbeda dari manusia pada elemen kognitif inti seperti memori, penalaran, dan kemampuan integrasi sensorik
  • Kerangka yang diusulkan memiliki potensi untuk digunakan sebagai standar evaluasi terstandarisasi dalam riset AGI di masa depan

Belum ada komentar.

Belum ada komentar.