Ilusi vibe coding, level kode AI, dan masa depannya
(medium.com)-
Belakangan ini, AI coding memang bisa dengan cepat membuat “kode yang berjalan”, tetapi belum mampu otomatis membuat “produk yang bagus” sesuai harapan pengguna
-
Penulis melihat penyebab utamanya ada 2
- Kurangnya common sense/pengetahuan implisit pada AI
- Dalam pembelajaran berbasis RLVR, strukturnya lebih mudah memberi imbalan pada “keberhasilan menjalankan kode” daripada “kode/produk yang baik”
-
Sebagai contoh, ia menyebut halusinasi Sejong the Great MacBook Pro, pengujian tempat cuci mobil, dan kegagalan menghasilkan gambar ruang kelas/siswa Korea, sambil menyoroti bahwa model terbaru pun bisa melewatkan keanehan yang langsung disadari manusia
-
Jika reward dalam coding RLVR terlalu condong ke apakah kode bisa dijalankan, LLM dapat membuat
try-except, fallback, dan logika defensif berlebihan yang menumpuk utang teknis -
Dalam Go, yang penting adalah menang, tetapi dalam software, yang dibutuhkan bukan sekadar “kurang lebih jalan”, melainkan “produk yang diinginkan orang dan mau mereka bayar”
-
Dari sudut pandang AJI (Artificial Jagged Intelligence) ala Karpathy, titik lemah AI saat ini ada pada area “taste”, naluri produk, dan common sense implisit
-
Anthropic juga menilai area desain/taste masih banyak ditangani manusia, tetapi batasnya terus dinegosiasikan ulang seiring model membaik
-
Penulis memprediksi kesenjangan ini akan makin mengecil seiring model meningkat, misalnya dari GPT-5.4 ke GPT-5.5
-
Pada akhirnya, jika AI memiliki tingkat sense dan penilaian yang sulit dibedakan dari manusia, ia akan lolos Turing Test, dan momen itu bisa dianggap sebagai AGI
Ringkasan:
Masalah AI coding bukanlah “tidak bisa menulis kode”, melainkan “dioptimalkan untuk hasil yang bisa dijalankan tanpa benar-benar memahami produk yang diinginkan manusia”. Peran manusia saat ini adalah melengkapi kekurangan AI dalam common sense, taste, dan penilaian produk.
10 komentar
Saya tidak tahu penulisnya itu siapa, tetapi secara pribadi ini adalah tulisan dengan kualitas paling rendah yang saya baca dalam 10 tahun terakhir.
Saya sangat terkejut sampai-sampai saat membacanya saya merasa bengong.
Kalau begitu, tolong tulis sendiri satu artikel yang bagus.
Ada bagian yang saya setujui dan ada juga yang tidak. Pada akhirnya, untuk saat ini tampaknya memang benar kecerdasan manusia masih perlu terlibat secara aktif. Para vibe coder juga, meski tidak bisa coding, tetap harus mengembangkan berdasarkan struktur perangkat lunak atau setidaknya pengetahuan dasar. Pada akhirnya, ide tanpa kemampuan mengelola dan tanpa pengetahuan domain saya rasa hanyalah istana pasir dan tidak akan bertahan lama.
Menurut saya, ini hanya memperpanjang hal-hal yang sudah jelas dan mencantumkan banyak nama terkenal, jadi tidak terlalu layak dibaca.
Saya juga tentu menganggap itu hal yang sudah jelas.
Namun, saya menulis artikel ini karena saya benar-benar mengalaminya sendiri dan juga mendengarnya di berbagai komunitas.
Duh duh duh duh
Ucapan yang sudah sering muncul sejak dulu. Tapi pada akhirnya ini masalah yang akan diselesaikan oleh waktu. Apakah 10 tahun lagi akan tetap seperti sekarang?
Saya rasa berbeda.
Jika suatu hari AI bisa mulai mempertanyakan hal-hal yang bahkan tidak ada di dalam instruksi dan menyampaikan pendapatnya,
barulah mungkin manusia benar-benar bisa tergantikan.
Tapi seperti orang kaya yang bepergian dengan sopir alih-alih mobil swakemudi,
kalau disuruh melakukan sesuatu, apakah insinyur masa depan (wujud saya) nantinya akan menjadi orang yang menggantikan proses pengecekan satu per satu?
Yang lebih penting daripada sekadar mempertanyakan kemampuan LLM pada level saat ini adalah memiliki "akal sehat manusia".
Beberapa tahun lalu, seorang tokoh terkenal pernah memprediksi bahwa di masa depan LLM akan bisa mengembangkan hal-hal yang diinginkan manusia dalam sekejap, sehingga perusahaan SW akan lenyap.