Ilusi vibe coding, level kode AI, dan masa depannya
(medium.com)-
Belakangan ini, AI coding memang bisa dengan cepat membuat “kode yang berjalan”, tetapi belum mampu otomatis membuat “produk yang bagus” sesuai harapan pengguna
-
Penulis melihat penyebab utamanya ada 2
- Kurangnya common sense/pengetahuan implisit pada AI
- Dalam pembelajaran berbasis RLVR, strukturnya lebih mudah memberi imbalan pada “keberhasilan menjalankan kode” daripada “kode/produk yang baik”
-
Sebagai contoh, ia menyebut halusinasi Sejong the Great MacBook Pro, pengujian tempat cuci mobil, dan kegagalan menghasilkan gambar ruang kelas/siswa Korea, sambil menyoroti bahwa model terbaru pun bisa melewatkan keanehan yang langsung disadari manusia
-
Jika reward dalam coding RLVR terlalu condong ke apakah kode bisa dijalankan, LLM dapat membuat
try-except, fallback, dan logika defensif berlebihan yang menumpuk utang teknis -
Dalam Go, yang penting adalah menang, tetapi dalam software, yang dibutuhkan bukan sekadar “kurang lebih jalan”, melainkan “produk yang diinginkan orang dan mau mereka bayar”
-
Dari sudut pandang AJI (Artificial Jagged Intelligence) ala Karpathy, titik lemah AI saat ini ada pada area “taste”, naluri produk, dan common sense implisit
-
Anthropic juga menilai area desain/taste masih banyak ditangani manusia, tetapi batasnya terus dinegosiasikan ulang seiring model membaik
-
Penulis memprediksi kesenjangan ini akan makin mengecil seiring model meningkat, misalnya dari GPT-5.4 ke GPT-5.5
-
Pada akhirnya, jika AI memiliki tingkat sense dan penilaian yang sulit dibedakan dari manusia, ia akan lolos Turing Test, dan momen itu bisa dianggap sebagai AGI
Ringkasan:
Masalah AI coding bukanlah “tidak bisa menulis kode”, melainkan “dioptimalkan untuk hasil yang bisa dijalankan tanpa benar-benar memahami produk yang diinginkan manusia”. Peran manusia saat ini adalah melengkapi kekurangan AI dalam common sense, taste, dan penilaian produk.
Belum ada komentar.