Andrej Karpathy: Coding AI Agen Telah Mengubah Dunia
(x.com/karpathy)> "Masa ketika kita mengetik kode secara langsung" telah berakhir
- Dalam 2 bulan terakhir, pemrograman mengalami perubahan drastis, bukan perkembangan bertahap, dan khususnya Desember lalu menjadi titik balik yang menentukan
- Kualitas, long-term coherence, tenacity model meningkat pesat sehingga kini mampu menyelesaikan tugas besar dan panjang sampai tuntas
- Akibatnya, terjadi perubahan yang sangat disruptif pada workflow pemrograman dasar yang selama ini digunakan
- Sebagai contoh, pada akhir pekan ia membangun dashboard analisis video lokal untuk kamera rumahnya
- Instruksi yang diberikan kepada agen
> "Saya akan memberi IP lokal DGX Spark serta nama pengguna/kata sandinya, jadi loginlah, lakukan pengaturan kunci SSH, konfigurasi vLLM, unduh dan benchmark Qwen3-VL, bangun endpoint server untuk inferensi video, buat dashboard web UI dasar, lakukan pengujian menyeluruh, atur layanan systemd, catat memo, lalu tulis laporan Markdown" - Agen tersebut bekerja secara otonom selama sekitar 30 menit: saat menemui berbagai masalah, ia meneliti solusi secara online, menyelesaikannya satu per satu, menulis kode, melakukan pengujian, debugging, mengatur layanan, lalu menyerahkan laporan
- Ia sendiri tidak menyentuh apa pun secara langsung; proyek yang 3 bulan lalu masih memerlukan satu akhir pekan penuh kini menjadi pekerjaan yang selesai jika ditinggal menunggu selama 30 menit
- Sejak komputer ditemukan, era mengetik kode langsung di editor kini telah berakhir
- Sekarang adalah era menjalankan agen AI, memberi instruksi pekerjaan dalam bahasa Inggris, lalu mengelola dan meninjau pekerjaan itu secara paralel
- Imbalan terbesar adalah terus menaikkan lapisan abstraksi, yaitu merancang orkestrator eksekusi jangka panjang dengan tool, memori, dan instruksi yang tepat agar bisa mengelola banyak instance Code paralel secara produktif
- Leverage yang bisa dicapai melalui "agentic engineering" tingkat tertinggi saat ini sangat besar
- Tentu saja, ini belum sempurna, dan masih membutuhkan penentuan arah tingkat tinggi, penilaian, taste, supervisi, kerja iteratif, serta pemberian petunjuk dan ide
- Ini bekerja jauh lebih baik pada skenario tertentu, terutama ketika spesifikasi tugas jelas dan fungsinya dapat diverifikasi/diuji
- Intinya adalah membangun intuisi untuk memecah tugas dengan tepat, menyerahkan bagian yang berjalan baik kepada agen, dan membantu pada bagian sisanya
- Industri software saat ini sama sekali bukan sedang berada dalam kondisi "business as usual"
5 komentar
Andrej Karpathy bilang begitu, ya memang begitu.
Saya bahkan tidak membuka VS Code, dan langsung menyuruh Copilot agent di halaman GitHub untuk mengerjakan coding di beberapa proyek. Agent itu bahkan langsung menampilkan screenshot halaman web sendiri lewat Playwright, semuanya bisa dilakukan.
Berkat itu, berbagai toy project yang tadinya mati mulai hidup kembali. :-)
Jadi begitulah kenapa orang bilang semua SaaS akan mati... kami juga secara bertahap mengganti alat internal dengan AI agent yang membuatnya satu per satu, dan saya juga agak takut era seperti apa yang akan datang setelah berakhirnya SaaS.
Alat internal atau SaaS dalam bentuk sederhana memang akan tergantikan dengan sangat cepat, tetapi dari sudut pandang solo developer yang membangun produk sendirian, justru sekarang terasa seperti era leverage yang luar biasa.
Kalau dulu 80% energi dihabiskan untuk "mengetik" demi mewujudkan ide, sekarang biaya pengembangan nyaris mendekati 0. Pada akhirnya, pertarungan ke depan rasanya akan sepenuhnya bergeser dari siapa yang paling jago menulis kode menjadi "siapa yang paling cepat menemukan ketidaknyamanan di pasar dan merencanakannya".
Rasanya era menulis kode dengan benar-benar mengetik sudah berakhir.
Saya mengerjakan 13 proyek yang diunggah ke aplikasi Codex, dan di antaranya hanya 3 yang jendela kodenya sedang terbuka.
Salah satu alat yang belakangan ini saya buat dan paling sering saya pakai, saya sama sekali belum pernah melihat kodenya.
Untuk penggunaan produksi, tentu masih perlu lewat code review dan masih banyak hal yang harus dipikirkan, tetapi untuk alat internal semacam itu, hasilnya benar-benar sangat bagus.