Ilusi klaim coding AI: mengapa ledakan 'shovelware' tidak kunjung terjadi

(mikelovesrobots.substack.com)

21 poin oleh GN⁺ 2025-09-04 | Belum ada komentar. | Bagikan ke WhatsApp

Hasil verifikasi berbasis data terhadap klaim peningkatan produktivitas dari alat coding AI belakangan ini menunjukkan bahwa kecepatan maupun output nyata tidak meningkat secara mencolok
Menurut riset METR, para pengembang percaya alat coding AI meningkatkan produktivitas sebesar 20%, tetapi kenyataannya justru turun 19%
Berbagai slogan promosi serta klaim berlebihan tentang produktivitas 10x dari perusahaan dan pengembang tidak tercermin dalam realitas pasar maupun peluncuran perangkat lunak baru
Fenomena seperti lonjakan Shovelware (aplikasi produksi massal, perangkat lunak berkualitas rendah) juga tidak teramati, sehingga tidak ada perubahan yang terlihat jelas
Pembesaran klaim produktivitas oleh perusahaan seperti GitHub, Copilot, Cursor, Google, OpenAI, serta sebagian pengembang, sedang disalahgunakan untuk investasi, restrukturisasi, dan penetapan gaji
Kesimpulan utamanya: “Selama perangkat lunak yang benar-benar dirilis tidak bertambah, klaim bahwa coding AI membuat pengembang 10x lebih produktif adalah fiksi”, sehingga pengembang tidak perlu goyah oleh tekanan dan harus merespons dengan data

Pendahuluan: pengembang perangkat lunak marah pada coding AI

Selama bertahun-tahun hidup sebagai pengembang perangkat lunak, penulis memiliki kebanggaan dan identitas terhadap pemrograman
Pada awal adopsi alat coding berbasis AI, ia menaruh harapan, tetapi belakangan menjadi skeptis setelah melihat riset METR
- Penulis sendiri merasa coding AI membuatnya sekitar 25% lebih cepat, tetapi riset METR justru menunjukkan hasil 19% lebih lambat
Riset tersebut menunjukkan bahwa persepsi pengembang terhadap efisiensi alat AI berbanding terbalik dengan data pengukuran nyata
Dari eksperimen pribadi pun, ia merasakan bahwa penggunaan AI tidak memberi dampak positif pada waktu pemrograman yang sebenarnya

Verifikasi langsung: eksperimen perbandingan AI vs acak

Diterapkan metode eksperimen yang mengukur selisih waktu (Delta) antara saat AI digunakan dan saat tidak digunakan untuk setiap unit pekerjaan
Data dari eksperimen selama 6 minggu tidak menemukan perbedaan yang signifikan secara statistik
Meski sampelnya kecil, terkonfirmasi kecenderungan bahwa penggunaan AI justru 21% lebih lambat dalam praktiknya (angka yang sama dengan riset METR)
Jika benar ada efek peningkatan 2x atau 10x, itu seharusnya akan tampak jelas di dalam data
Mimpi coding AI saat ini belum terwujud, dan pada praktiknya tidak ada perubahan nyata

Harapan dan realitas: mengapa tidak ada ledakan Shovelware

Jika revolusi produktivitas dari coding AI benar nyata, seharusnya terjadi ledakan berbagai aplikasi, layanan, dan game
Pesan pemasaran dari banyak alat coding AI (seperti “Built to make you extraordinarily productive”) bertebaran di mana-mana
Google, OpenAI, GitHub Copilot, dan lainnya juga mengklaim peningkatan kecepatan 25% atau produktivitas 10x untuk pengembang
Namun, data peluncuran perangkat lunak baru yang nyata (GH Archive, BigQuery, dll.) tidak menunjukkan pertumbuhan tajam maupun fenomena ledakan
Meski coding AI telah tersebar luas sejak 2022, angka rilis dan proyek baru secara global tidak menunjukkan perubahan besar

Dampak pasar dan realitas pengembang

Muncul pula dampak sosial di dalam industri seperti strategi AI-First, FOMO, PHK massal, dan penurunan gaji pengembang
Di lapangan, alat AI tidak mampu menghadirkan revolusi produktivitas
Kurva belajar maupun tingkat kemahiran terhadap alat tersebut juga tidak bisa menjelaskan perbedaan produktivitas absolut

Kesimpulan: perlunya penilaian dingin berbasis data

Intinya adalah memastikan lewat data bahwa jumlah perangkat lunak baru yang dirilis sejauh ini belum berubah
Tidak ada bukti untuk klaim bahwa AI telah menciptakan coder 10x
Pengembang tidak boleh tunduk pada tekanan, dan harus memilih alat berdasarkan data yang mereka verifikasi sendiri

Bantahan terhadap sanggahan yang sering muncul

"Kalau benar-benar menguasai prompt engineering, kita bisa jadi pengembang 10x"
- Jika memang ada orang yang mencapai produktivitas 10x, maka produksi perangkat lunak baru global seharusnya sudah meningkat lebih dari dua kali lipat
- Bukti yang lebih penting daripada klaim adalah hasil objektif (aplikasi, proyek, dll.)
"Ini masih tahap awal, jadi butuh waktu"
- Sudah ada investasi puluhan miliar dolar dan penerapan nyata di lingkungan kerja
- Keputusan hari ini berdampak langsung pada kehidupan orang nyata
"Kalau tidak adopsi sekarang, kita akan tertinggal"
- Bahkan dalam data Github Copilot, kenaikan produktivitas riil akibat peningkatan kemahiran sangat kecil (tingkat penerimaan 29% → 34%)
"Kualitasnya saja yang membaik, jumlahnya tetap"
- Secara keseluruhan, kualitas industri justru mengalami kemunduran dan pengujian juga berkurang
- Jika benar ini alat untuk coder 10x, maka banjir Shovelware seharusnya sudah menjadi kenyataan
"Semuanya sekarang berpusat pada website, dan orang sudah tidak peduli nama domain. Subdomain di layanan seperti Vercel sudah cukup"
- Masih banyak pengguna yang tetap lebih menyukai domain sendiri
"Ledakan domain .ai (47% tahun ini) = kenaikan nyata"
- Kenaikan domain baru lebih merupakan akibat pivot startup AI, bukan ledakan jumlah domain baru secara keseluruhan
- Total jumlah domain secara umum tidak menunjukkan hal itu
"Hakikat pengembangan itu ada pada pekerjaan di luar kode"
- Di lingkungan pengembang individu/skala kecil, bukan perusahaan besar, kode tetap menjadi pusat
- Tetap belum terlihat peningkatan mencolok pada proyek-proyek baru yang memenuhi kebutuhan coding kecil sehari-hari

Penutup

Pengembang pada kenyataannya tidak merilis lebih banyak hal
Klaim bahwa coding AI memberi produktivitas 10x dapat dipatahkan dengan data
Jangan terombang-ambing oleh FOMO dan narasi pemasaran industri; lakukan penilaian berdasarkan hasil nyata
Pesan penulis: “Kalau Anda merasa tertekan, tunjukkan data dan grafik. Untuk klaim produktivitas 10x, minta buktinya.”

Ilusi klaim coding AI: mengapa ledakan 'shovelware' tidak kunjung terjadi

Pendahuluan: pengembang perangkat lunak marah pada coding AI

Verifikasi langsung: eksperimen perbandingan AI vs acak

Harapan dan realitas: mengapa tidak ada ledakan Shovelware

Dampak pasar dan realitas pengembang

Kesimpulan: perlunya penilaian dingin berbasis data

Bantahan terhadap sanggahan yang sering muncul

Penutup

Bacaan terkait

Belum ada komentar.