21 poin oleh GN⁺ 2025-12-26 | Belum ada komentar. | Bagikan ke WhatsApp
  • Tahun 2025 adalah tahun ketika alat coding agentik mulai benar-benar mengubah cara pemrograman, dengan pergeseran dari mengetik langsung di keyboard menjadi beralih ke peran engineering lead yang mengarahkan programmer magang virtual
  • Berawal dari obsesi pada Claude Code, lalu berulang kali membangun dan memakai agen sendiri, penulis makin yakin bahwa pendekatan terbaik masih berupa generasi kode, sistem berkas, pemanggilan alat pemrograman melalui glue interpreter, dan pembelajaran berbasis skill
  • Kombinasi LLM dan eksekusi alat meluas dari sekadar pembuatan kode ke perapian pekerjaan sehari-hari, sambil memunculkan pertanyaan ulang tentang relasi dengan mesin dan kekhawatiran atas terbentuknya ikatan parasosial (Parasocial Bond) yang tidak disengaja
  • Karena sistem kontrol versi dan alat code review yang ada tidak cocok untuk meninjau kode hasil AI, dibutuhkan sistem baru yang bisa melacak riwayat prompt hingga jalur kegagalan
  • Coding dengan AI memunculkan banjir opini yang bergantung pada "vibes" tanpa pengalaman dan data, sekaligus kebutuhan akan kesepakatan sosial baru terhadap PR buatan AI yang dilempar sembarangan ke open source

Perubahan di 2025

  • Ini adalah tahun ketika penulis bukan hanya keluar dari perusahaan untuk memulai perusahaan baru, tetapi juga sepenuhnya mengubah cara memprogram yang selama ini dipakai
  • Sejak Juni, penulis hampir sepenuhnya memakai Claude Code secara hands-off alih-alih Cursor
    • "Kalau enam bulan lalu ada yang bilang saya akan lebih suka berperan sebagai engineering lead bagi programmer magang virtual, saya tidak akan percaya"
  • Menulis 36 post, sekitar 18% dari seluruh tulisan blog sejak 2007
    • Setelah terjerumus ke rabbit hole agen, rasa ingin tahu membuat penulis melakukan sekitar 100 percakapan dengan programmer, pendiri startup, dan lainnya
  • Tahun 2025 juga merupakan tahun yang buruk secara global, sehingga penulis membuat blog terpisah (dark.ronacher.eu) untuk memisahkan pikiran-pikiran itu

Tahun para agen

  • Dimulai dari obsesi pada Claude Code pada April-Mei, lalu berbulan-bulan bolak-balik antara membangun agen sendiri dan memakai agen buatan orang lain
  • Beragam opini tentang AI meledak di media sosial
  • Kini sampai pada kondisi yang stabil: fokus pada generasi kode, sistem berkas, pemanggilan alat secara terprogram melalui interpreter glue, dan pembelajaran berbasis skill
    • Cara yang dipopulerkan Claude Code masih menjadi yang paling mutakhir, dan para penyedia foundation model yang juga berfokus pada skill makin menguatkan keyakinan ini
  • Kembalinya TUI (text-based user interface) secara kuat terasa mengejutkan
    • Saat ini penulis memakai Amp, Claude Code, dan Pi di command line
    • Amp terasa seperti Apple atau Porsche, Claude Code seperti Volkswagen murah, dan Pi adalah pilihan open source yang disukai para hacker
    • Semuanya terasa seperti proyek yang dibuat oleh orang-orang yang terlalu sering memakai produk mereka sendiri, tetapi masing-masing punya trade-off yang berbeda
  • Penulis terus dibuat takjub oleh kombinasi LLM dan eksekusi alat
    • Awal tahun alat ini terutama dipakai untuk generasi kode, tetapi sekarang agen banyak dipakai juga untuk tugas harian
    • Penulis memperkirakan akan ada kemajuan menarik menuju produk konsumen pada 2026
    • Kini LLM membantu merapikan hidup, dan kegunaannya diperkirakan akan makin besar

Saya dan mesin

  • Saat LLM membantu bukan hanya dalam pemrograman tetapi juga area lain, penulis mulai memikirkan ulang hubungan dengan mesin
  • Menjadi makin sulit untuk tidak membentuk ikatan parasosial (Parasocial Bond) dengan alat-alat ini, dan hal itu terasa aneh serta tidak nyaman
  • Kebanyakan agen saat ini nyaris tidak punya memori dan hampir tidak punya kepribadian, tetapi membuat agen yang punya hal-hal itu sendiri ternyata mudah
    • LLM dengan memori adalah pengalaman yang sulit dilepaskan
  • Selama dua tahun, penulis melatih diri untuk menganggap model-model ini sekadar token tumbler, tetapi cara pandang yang disederhanakan itu kini tidak lagi cukup
  • Sistem yang kita bangun memang punya kecenderungan manusiawi, tetapi mengangkatnya ke level manusia adalah sebuah kesalahan
  • Penulis makin bermasalah dengan istilah "agen", tetapi belum ada kata yang lebih baik
    • Karena agensi dan tanggung jawab harus tetap berada pada manusia
    • Apa pun bentuk akhirnya, jika tidak hati-hati ini bisa memicu respons emosional yang berbahaya (lihat chatbot psychosis)
    • Tantangan yang harus diselesaikan adalah gagal menamai dan memosisikan ciptaan ini secara tepat dalam relasinya dengan kita
  • Karena antropomorfisme yang tak disengaja ini, menjadi sulit mencari bahasa yang tepat untuk menjelaskan cara bekerja dengan mesin
    • Ini bukan cuma masalah penulis; orang lain juga mengalaminya
    • Saat ini hal itu malah makin menimbulkan ketidaknyamanan ketika bekerja dengan orang yang sepenuhnya menolak sistem seperti ini
    • Salah satu komentar paling umum pada artikel tentang alat coding agentik adalah penolakan terhadap pemberian kepribadian pada mesin

Opini ada di mana-mana

  • Saat banyak memakai AI, satu aspek yang tak terduga adalah bahwa penulis jauh lebih banyak bicara tentang vibes daripada hal lain mana pun
  • Cara kerja ini bahkan belum berumur satu tahun, tetapi sudah menantang setengah abad pengalaman software engineering
  • Opini sangat banyak, tetapi sulit mengatakan mana yang akan bertahan menghadapi ujian waktu
  • Ada banyak kebijaksanaan konvensional yang tidak disetujui, tetapi penulis juga tidak punya dasar kuat untuk menopang opininya sendiri
    • Sepanjang tahun penulis cukup vokal membagikan kesulitan dengan MCP, tetapi tidak punya dasar selain "buat saya ini tidak jalan"; sementara orang lain sangat meyakininya
    • Hal yang sama berlaku untuk pemilihan model: Peter (orang yang membuat penulis jatuh hati pada Claude di awal tahun) pindah ke Codex dan puas; penulis juga jadi lebih sering memakai Codex, tetapi tetap tidak semenyenangkan Claude
    • Tidak ada dasar untuk preferensi terhadap Claude selain vibes
  • Penting juga untuk tahu bahwa sebagian vibes datang bersama sinyal yang memang disengaja
    • Banyak pandangan orang yang terlihat online punya kepentingan finansial pada satu produk dibanding produk lain, entah sebagai investor atau influencer berbayar
    • Mereka mungkin jadi investor karena memang menyukai produknya, tetapi bisa juga pandangan mereka dibentuk dan dipengaruhi oleh hubungan tersebut

Outsourcing vs membangun sendiri

  • Saat melihat library milik perusahaan AI hari ini, sering kali bisa ditebak bahwa itu dibuat dengan Stainless atau Fern
    • Dokumentasinya memakai Mintlify, dan sistem autentikasi situsnya mungkin Clerk
  • Semakin banyak layanan yang dulu akan dibangun sendiri kini di-outsourcing ke perusahaan khusus, dan ini menaikkan standar untuk sebagian aspek pengalaman pengguna
  • Namun dengan kekuatan baru alat coding agentik, banyak dari hal ini sebenarnya bisa dibuat sendiri
    • Penulis meminta Claude membuat generator SDK untuk Python dan TypeScript — setengah karena penasaran, setengah karena terlihat cukup mudah
  • Sebagai pendukung kode yang sederhana dan membangun sendiri, penulis agak optimistis AI berpotensi mendorong kita membangun di atas ketergantungan yang lebih sedikit
  • Pada saat yang sama, melihat tren saat ini yang serba outsourcing, belum jelas apakah kita benar-benar bergerak ke arah itu

Yang dipelajari dan yang diharapkan

  • Mulai dari sini, penulis ingin bicara bukan tentang prediksi, melainkan tentang harapan atas area yang layak dicurahkan energi berikutnya
  • Penulis tidak tahu persis apa yang dicari, tetapi ingin menunjukkan titik-titik sakit dan memberi konteks serta bahan pemikiran
  • Jenis baru kontrol versi

    • Penemuan tak terduga terbesar: alat lama untuk berbagi kode sudah mencapai batasnya
    • Model pull request GitHub tidak memuat cukup informasi untuk meninjau kode hasil AI dengan baik — akan sangat berguna jika kita bisa melihat prompt yang mendorong perubahan itu
    • Ini bukan hanya masalah GitHub; git pun juga kurang memadai
    • Salah satu hal yang membuat model bekerja dalam coding agentik saat ini adalah mengetahui kesalahan
      • Saat kembali ke keadaan sebelumnya, kita ingin alat ini ingat apa yang salah
      • Tidak ada istilah yang lebih baik, tetapi kegagalan punya nilai
      • Sebagai manusia pun, mengetahui jalur yang tidak membawa ke mana-mana bisa membantu, tetapi bagi mesin ini adalah informasi yang penting
      • Penulis menyadari ini ketika mencoba memampatkan riwayat percakapan: jika jalur yang salah dibuang, model akan mencoba kesalahan yang sama lagi
    • Beberapa alat coding agentik bisa memutar worktree, membuat checkpoint di git untuk pemulihan, serta menyediakan branching dan undo di dalam percakapan
    • Masih ada ruang besar untuk inovasi UX agar alat-alat seperti ini lebih mudah dipakai
      • Itulah sebabnya muncul pembicaraan tentang stacked diffs dan sistem kontrol versi alternatif seperti Jujutsu
    • Penulis tidak tahu apakah ini akan mengubah GitHub atau membuka ruang bagi pesaing baru, tetapi berharap yang kedua yang terjadi
    • Penulis benar-benar ingin lebih memahami input manusia dan membedakannya dari output mesin
    • Penulis ingin melihat prompt dan percobaan yang gagal
    • Lalu ingin ada cara untuk memampatkan semuanya saat merge, tetapi tetap bisa menelusuri riwayat lengkap bila perlu
  • Jenis baru review

    • Masih terkait kontrol versi: alat code review saat ini menetapkan definisi peran yang kaku dan tidak cocok dengan AI
    • Contoh UI code review GitHub: penulis rutin ingin memakai komentar pada tampilan PR untuk meninggalkan catatan kepada agen sendiri, tetapi tidak ada alur terpandu untuk itu
      • Antarmuka review tidak mengizinkan kita mereview kode sendiri dan hanya mengizinkan komentar, tetapi itu bukan niat yang sama
    • Masalah lain adalah meningkatnya porsi review kode yang kini terjadi secara lokal antara penulis dan agen
      • Contoh: fitur code review Codex milik GitHub hanya bisa terikat ke satu organisasi pada satu waktu, sehingga sering gagal berfungsi
      • Sekarang penulis melakukan review lewat Codex di command line, tetapi itu berarti seluruh bagian dari siklus iterasi tidak terlihat oleh engineer lain di tim; ini tidak bisa dibiarkan
    • Rasanya code review harus menjadi bagian dari VCS
  • Observability jenis baru

    • Observability layak kembali mendapat sorotan
    • Sekarang muncul kebutuhan sekaligus peluang untuk memanfaatkannya pada level yang sepenuhnya baru
    • Kebanyakan orang sebelumnya tidak berada dalam posisi untuk membuat program eBPF sendiri, tetapi LLM bisa
    • Banyak alat observability menghindari SQL karena kompleksitas, tetapi LLM jauh lebih baik dalam SQL dibanding bahasa query proprietari mana pun
      • Bisa menulis query, grep, map-reduce, dan mengendalikan LLDB dari jarak jauh
      • Apa pun yang punya struktur dan teks tiba-tiba menjadi tanah yang sangat subur bagi keberhasilan alat coding agentik
    • Penulis tidak tahu observability masa depan akan seperti apa, tetapi punya intuisi kuat bahwa banyak inovasi akan muncul di sini
      • Semakin baik feedback loop untuk mesin, semakin baik hasilnya
    • Penulis juga belum benar-benar yakin apa tepatnya yang diminta, tetapi salah satu tantangan lama adalah banyak ide keren untuk observability yang lebih baik — terutama rekonfigurasi dinamis layanan untuk filtering yang lebih terarah — terlalu kompleks dan sulit dipakai sehingga tidak ramah pengguna
      • Namun sekarang, dengan meningkatnya kemampuan LLM mengerjakan bagian yang sulit itu, solusi-solusi tersebut bisa jadi justru yang tepat
      • Contoh: Python 3.14 membawa external debugger interface — fitur yang luar biasa untuk alat coding agentik
  • Bekerja bersama slop

    • Ini mungkin agak kontroversial, tetapi yang belum berhasil dilakukan penulis tahun ini adalah benar-benar menyerahkan semuanya ke mesin
    • Penulis masih menanganinya seperti software engineering biasa dan melakukan banyak review
    • Penulis makin sadar bahwa semakin banyak orang tidak bekerja dengan model engineering ini, dan malah sepenuhnya menyerahkannya ke mesin
      • Kedengarannya gila, tetapi penulis melihat sebagian orang cukup berhasil melakukannya
      • Penulis masih belum tahu bagaimana harus memikirkan hal ini, tetapi jelas bahwa bahkan jika hasil akhirnya tetap berupa kode, cara kerja di dunia baru itu sangat berbeda dari dunia yang membuat penulis nyaman
      • Karena dunia itu sudah hadir, mungkin kita butuh kontrak sosial baru untuk membedakan hal-hal ini
    • Versi yang paling jelas terlihat adalah meningkatnya kontribusi jenis ini ke proyek open source
      • Terus terang, bagi orang yang tidak bekerja dengan model itu, hal ini terasa menghina
      • Membaca pull request seperti itu menimbulkan kemarahan yang cukup besar
    • Secara pribadi, penulis mencoba menyerang masalah ini lewat pedoman kontribusi dan template pull request
      • Namun ini terasa seperti melawan kincir angin
      • Solusinya mungkin bukan datang dari mengubah apa yang kita lakukan
      • Sebaliknya, solusinya bisa datang dari orang-orang yang lantang mendukung AI engineering untuk juga menjelaskan perilaku baik seperti apa dalam codebase agentik
      • Dan itu bukan melempar kode yang belum direview lalu membiarkan orang lain membereskan masalahnya

Belum ada komentar.

Belum ada komentar.