1 poin oleh brainer 2 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Belakangan ini, AI coding memang bisa dengan cepat membuat “kode yang berjalan”, tetapi belum mampu otomatis membuat “produk yang bagus” sesuai harapan pengguna

  • Penulis melihat penyebab utamanya ada 2

    • Kurangnya common sense/pengetahuan implisit pada AI
    • Dalam pembelajaran berbasis RLVR, strukturnya lebih mudah memberi imbalan pada “keberhasilan menjalankan kode” daripada “kode/produk yang baik”
  • Sebagai contoh, ia menyebut halusinasi Sejong the Great MacBook Pro, pengujian tempat cuci mobil, dan kegagalan menghasilkan gambar ruang kelas/siswa Korea, sambil menyoroti bahwa model terbaru pun bisa melewatkan keanehan yang langsung disadari manusia

  • Jika reward dalam coding RLVR terlalu condong ke apakah kode bisa dijalankan, LLM dapat membuat try-except, fallback, dan logika defensif berlebihan yang menumpuk utang teknis

  • Dalam Go, yang penting adalah menang, tetapi dalam software, yang dibutuhkan bukan sekadar “kurang lebih jalan”, melainkan “produk yang diinginkan orang dan mau mereka bayar”

  • Dari sudut pandang AJI (Artificial Jagged Intelligence) ala Karpathy, titik lemah AI saat ini ada pada area “taste”, naluri produk, dan common sense implisit

  • Anthropic juga menilai area desain/taste masih banyak ditangani manusia, tetapi batasnya terus dinegosiasikan ulang seiring model membaik

  • Penulis memprediksi kesenjangan ini akan makin mengecil seiring model meningkat, misalnya dari GPT-5.4 ke GPT-5.5

  • Pada akhirnya, jika AI memiliki tingkat sense dan penilaian yang sulit dibedakan dari manusia, ia akan lolos Turing Test, dan momen itu bisa dianggap sebagai AGI

Ringkasan:
Masalah AI coding bukanlah “tidak bisa menulis kode”, melainkan “dioptimalkan untuk hasil yang bisa dijalankan tanpa benar-benar memahami produk yang diinginkan manusia”. Peran manusia saat ini adalah melengkapi kekurangan AI dalam common sense, taste, dan penilaian produk.

Belum ada komentar.

Belum ada komentar.