Tahun Vibes

(lucumr.pocoo.org)

21 poin oleh GN⁺ 2025-12-26 | 1 komentar | Bagikan ke WhatsApp

Tahun 2025 adalah tahun ketika alat coding agentik mulai benar-benar mengubah cara pemrograman, dengan pergeseran dari mengetik langsung di keyboard menjadi beralih ke peran engineering lead yang mengarahkan programmer magang virtual
Berawal dari obsesi pada Claude Code, lalu berulang kali membangun dan memakai agen sendiri, penulis makin yakin bahwa pendekatan terbaik masih berupa generasi kode, sistem berkas, pemanggilan alat pemrograman melalui glue interpreter, dan pembelajaran berbasis skill
Kombinasi LLM dan eksekusi alat meluas dari sekadar pembuatan kode ke perapian pekerjaan sehari-hari, sambil memunculkan pertanyaan ulang tentang relasi dengan mesin dan kekhawatiran atas terbentuknya ikatan parasosial (Parasocial Bond) yang tidak disengaja
Karena sistem kontrol versi dan alat code review yang ada tidak cocok untuk meninjau kode hasil AI, dibutuhkan sistem baru yang bisa melacak riwayat prompt hingga jalur kegagalan
Coding dengan AI memunculkan banjir opini yang bergantung pada "vibes" tanpa pengalaman dan data, sekaligus kebutuhan akan kesepakatan sosial baru terhadap PR buatan AI yang dilempar sembarangan ke open source

Perubahan di 2025

Ini adalah tahun ketika penulis bukan hanya keluar dari perusahaan untuk memulai perusahaan baru, tetapi juga sepenuhnya mengubah cara memprogram yang selama ini dipakai
Sejak Juni, penulis hampir sepenuhnya memakai Claude Code secara hands-off alih-alih Cursor
- "Kalau enam bulan lalu ada yang bilang saya akan lebih suka berperan sebagai engineering lead bagi programmer magang virtual, saya tidak akan percaya"
Menulis 36 post, sekitar 18% dari seluruh tulisan blog sejak 2007
- Setelah terjerumus ke rabbit hole agen, rasa ingin tahu membuat penulis melakukan sekitar 100 percakapan dengan programmer, pendiri startup, dan lainnya
Tahun 2025 juga merupakan tahun yang buruk secara global, sehingga penulis membuat blog terpisah (dark.ronacher.eu) untuk memisahkan pikiran-pikiran itu

Tahun para agen

Dimulai dari obsesi pada Claude Code pada April-Mei, lalu berbulan-bulan bolak-balik antara membangun agen sendiri dan memakai agen buatan orang lain
Beragam opini tentang AI meledak di media sosial
Kini sampai pada kondisi yang stabil: fokus pada generasi kode, sistem berkas, pemanggilan alat secara terprogram melalui interpreter glue, dan pembelajaran berbasis skill
- Cara yang dipopulerkan Claude Code masih menjadi yang paling mutakhir, dan para penyedia foundation model yang juga berfokus pada skill makin menguatkan keyakinan ini
Kembalinya TUI (text-based user interface) secara kuat terasa mengejutkan
- Saat ini penulis memakai Amp, Claude Code, dan Pi di command line
- Amp terasa seperti Apple atau Porsche, Claude Code seperti Volkswagen murah, dan Pi adalah pilihan open source yang disukai para hacker
- Semuanya terasa seperti proyek yang dibuat oleh orang-orang yang terlalu sering memakai produk mereka sendiri, tetapi masing-masing punya trade-off yang berbeda
Penulis terus dibuat takjub oleh kombinasi LLM dan eksekusi alat
- Awal tahun alat ini terutama dipakai untuk generasi kode, tetapi sekarang agen banyak dipakai juga untuk tugas harian
- Penulis memperkirakan akan ada kemajuan menarik menuju produk konsumen pada 2026
- Kini LLM membantu merapikan hidup, dan kegunaannya diperkirakan akan makin besar

Saya dan mesin

Saat LLM membantu bukan hanya dalam pemrograman tetapi juga area lain, penulis mulai memikirkan ulang hubungan dengan mesin
Menjadi makin sulit untuk tidak membentuk ikatan parasosial (Parasocial Bond) dengan alat-alat ini, dan hal itu terasa aneh serta tidak nyaman
Kebanyakan agen saat ini nyaris tidak punya memori dan hampir tidak punya kepribadian, tetapi membuat agen yang punya hal-hal itu sendiri ternyata mudah
- LLM dengan memori adalah pengalaman yang sulit dilepaskan
Selama dua tahun, penulis melatih diri untuk menganggap model-model ini sekadar token tumbler, tetapi cara pandang yang disederhanakan itu kini tidak lagi cukup
Sistem yang kita bangun memang punya kecenderungan manusiawi, tetapi mengangkatnya ke level manusia adalah sebuah kesalahan
Penulis makin bermasalah dengan istilah "agen", tetapi belum ada kata yang lebih baik
- Karena agensi dan tanggung jawab harus tetap berada pada manusia
- Apa pun bentuk akhirnya, jika tidak hati-hati ini bisa memicu respons emosional yang berbahaya (lihat chatbot psychosis)
- Tantangan yang harus diselesaikan adalah gagal menamai dan memosisikan ciptaan ini secara tepat dalam relasinya dengan kita
Karena antropomorfisme yang tak disengaja ini, menjadi sulit mencari bahasa yang tepat untuk menjelaskan cara bekerja dengan mesin
- Ini bukan cuma masalah penulis; orang lain juga mengalaminya
- Saat ini hal itu malah makin menimbulkan ketidaknyamanan ketika bekerja dengan orang yang sepenuhnya menolak sistem seperti ini
- Salah satu komentar paling umum pada artikel tentang alat coding agentik adalah penolakan terhadap pemberian kepribadian pada mesin

Opini ada di mana-mana

Saat banyak memakai AI, satu aspek yang tak terduga adalah bahwa penulis jauh lebih banyak bicara tentang vibes daripada hal lain mana pun
Cara kerja ini bahkan belum berumur satu tahun, tetapi sudah menantang setengah abad pengalaman software engineering
Opini sangat banyak, tetapi sulit mengatakan mana yang akan bertahan menghadapi ujian waktu
Ada banyak kebijaksanaan konvensional yang tidak disetujui, tetapi penulis juga tidak punya dasar kuat untuk menopang opininya sendiri
- Sepanjang tahun penulis cukup vokal membagikan kesulitan dengan MCP, tetapi tidak punya dasar selain "buat saya ini tidak jalan"; sementara orang lain sangat meyakininya
- Hal yang sama berlaku untuk pemilihan model: Peter (orang yang membuat penulis jatuh hati pada Claude di awal tahun) pindah ke Codex dan puas; penulis juga jadi lebih sering memakai Codex, tetapi tetap tidak semenyenangkan Claude
- Tidak ada dasar untuk preferensi terhadap Claude selain vibes
Penting juga untuk tahu bahwa sebagian vibes datang bersama sinyal yang memang disengaja
- Banyak pandangan orang yang terlihat online punya kepentingan finansial pada satu produk dibanding produk lain, entah sebagai investor atau influencer berbayar
- Mereka mungkin jadi investor karena memang menyukai produknya, tetapi bisa juga pandangan mereka dibentuk dan dipengaruhi oleh hubungan tersebut

Outsourcing vs membangun sendiri

Saat melihat library milik perusahaan AI hari ini, sering kali bisa ditebak bahwa itu dibuat dengan Stainless atau Fern
- Dokumentasinya memakai Mintlify, dan sistem autentikasi situsnya mungkin Clerk
Semakin banyak layanan yang dulu akan dibangun sendiri kini di-outsourcing ke perusahaan khusus, dan ini menaikkan standar untuk sebagian aspek pengalaman pengguna
Namun dengan kekuatan baru alat coding agentik, banyak dari hal ini sebenarnya bisa dibuat sendiri
- Penulis meminta Claude membuat generator SDK untuk Python dan TypeScript — setengah karena penasaran, setengah karena terlihat cukup mudah
Sebagai pendukung kode yang sederhana dan membangun sendiri, penulis agak optimistis AI berpotensi mendorong kita membangun di atas ketergantungan yang lebih sedikit
Pada saat yang sama, melihat tren saat ini yang serba outsourcing, belum jelas apakah kita benar-benar bergerak ke arah itu

Yang dipelajari dan yang diharapkan

Mulai dari sini, penulis ingin bicara bukan tentang prediksi, melainkan tentang harapan atas area yang layak dicurahkan energi berikutnya
Penulis tidak tahu persis apa yang dicari, tetapi ingin menunjukkan titik-titik sakit dan memberi konteks serta bahan pemikiran
Jenis baru kontrol versi
- Penemuan tak terduga terbesar: alat lama untuk berbagi kode sudah mencapai batasnya
- Model pull request GitHub tidak memuat cukup informasi untuk meninjau kode hasil AI dengan baik — akan sangat berguna jika kita bisa melihat prompt yang mendorong perubahan itu
- Ini bukan hanya masalah GitHub; git pun juga kurang memadai
- Salah satu hal yang membuat model bekerja dalam coding agentik saat ini adalah mengetahui kesalahan
  - Saat kembali ke keadaan sebelumnya, kita ingin alat ini ingat apa yang salah
  - Tidak ada istilah yang lebih baik, tetapi kegagalan punya nilai
  - Sebagai manusia pun, mengetahui jalur yang tidak membawa ke mana-mana bisa membantu, tetapi bagi mesin ini adalah informasi yang penting
  - Penulis menyadari ini ketika mencoba memampatkan riwayat percakapan: jika jalur yang salah dibuang, model akan mencoba kesalahan yang sama lagi
- Beberapa alat coding agentik bisa memutar worktree, membuat checkpoint di git untuk pemulihan, serta menyediakan branching dan undo di dalam percakapan
- Masih ada ruang besar untuk inovasi UX agar alat-alat seperti ini lebih mudah dipakai
  - Itulah sebabnya muncul pembicaraan tentang stacked diffs dan sistem kontrol versi alternatif seperti Jujutsu
- Penulis tidak tahu apakah ini akan mengubah GitHub atau membuka ruang bagi pesaing baru, tetapi berharap yang kedua yang terjadi
- Penulis benar-benar ingin lebih memahami input manusia dan membedakannya dari output mesin
- Penulis ingin melihat prompt dan percobaan yang gagal
- Lalu ingin ada cara untuk memampatkan semuanya saat merge, tetapi tetap bisa menelusuri riwayat lengkap bila perlu
Jenis baru review
- Masih terkait kontrol versi: alat code review saat ini menetapkan definisi peran yang kaku dan tidak cocok dengan AI
- Contoh UI code review GitHub: penulis rutin ingin memakai komentar pada tampilan PR untuk meninggalkan catatan kepada agen sendiri, tetapi tidak ada alur terpandu untuk itu
  - Antarmuka review tidak mengizinkan kita mereview kode sendiri dan hanya mengizinkan komentar, tetapi itu bukan niat yang sama
- Masalah lain adalah meningkatnya porsi review kode yang kini terjadi secara lokal antara penulis dan agen
  - Contoh: fitur code review Codex milik GitHub hanya bisa terikat ke satu organisasi pada satu waktu, sehingga sering gagal berfungsi
  - Sekarang penulis melakukan review lewat Codex di command line, tetapi itu berarti seluruh bagian dari siklus iterasi tidak terlihat oleh engineer lain di tim; ini tidak bisa dibiarkan
- Rasanya code review harus menjadi bagian dari VCS
Observability jenis baru
- Observability layak kembali mendapat sorotan
- Sekarang muncul kebutuhan sekaligus peluang untuk memanfaatkannya pada level yang sepenuhnya baru
- Kebanyakan orang sebelumnya tidak berada dalam posisi untuk membuat program eBPF sendiri, tetapi LLM bisa
- Banyak alat observability menghindari SQL karena kompleksitas, tetapi LLM jauh lebih baik dalam SQL dibanding bahasa query proprietari mana pun
  - Bisa menulis query, grep, map-reduce, dan mengendalikan LLDB dari jarak jauh
  - Apa pun yang punya struktur dan teks tiba-tiba menjadi tanah yang sangat subur bagi keberhasilan alat coding agentik
- Penulis tidak tahu observability masa depan akan seperti apa, tetapi punya intuisi kuat bahwa banyak inovasi akan muncul di sini
  - Semakin baik feedback loop untuk mesin, semakin baik hasilnya
- Penulis juga belum benar-benar yakin apa tepatnya yang diminta, tetapi salah satu tantangan lama adalah banyak ide keren untuk observability yang lebih baik — terutama rekonfigurasi dinamis layanan untuk filtering yang lebih terarah — terlalu kompleks dan sulit dipakai sehingga tidak ramah pengguna
  - Namun sekarang, dengan meningkatnya kemampuan LLM mengerjakan bagian yang sulit itu, solusi-solusi tersebut bisa jadi justru yang tepat
  - Contoh: Python 3.14 membawa external debugger interface — fitur yang luar biasa untuk alat coding agentik
Bekerja bersama slop
- Ini mungkin agak kontroversial, tetapi yang belum berhasil dilakukan penulis tahun ini adalah benar-benar menyerahkan semuanya ke mesin
- Penulis masih menanganinya seperti software engineering biasa dan melakukan banyak review
- Penulis makin sadar bahwa semakin banyak orang tidak bekerja dengan model engineering ini, dan malah sepenuhnya menyerahkannya ke mesin
  - Kedengarannya gila, tetapi penulis melihat sebagian orang cukup berhasil melakukannya
  - Penulis masih belum tahu bagaimana harus memikirkan hal ini, tetapi jelas bahwa bahkan jika hasil akhirnya tetap berupa kode, cara kerja di dunia baru itu sangat berbeda dari dunia yang membuat penulis nyaman
  - Karena dunia itu sudah hadir, mungkin kita butuh kontrak sosial baru untuk membedakan hal-hal ini
- Versi yang paling jelas terlihat adalah meningkatnya kontribusi jenis ini ke proyek open source
  - Terus terang, bagi orang yang tidak bekerja dengan model itu, hal ini terasa menghina
  - Membaca pull request seperti itu menimbulkan kemarahan yang cukup besar
- Secara pribadi, penulis mencoba menyerang masalah ini lewat pedoman kontribusi dan template pull request
  - Namun ini terasa seperti melawan kincir angin
  - Solusinya mungkin bukan datang dari mengubah apa yang kita lakukan
  - Sebaliknya, solusinya bisa datang dari orang-orang yang lantang mendukung AI engineering untuk juga menjelaskan perilaku baik seperti apa dalam codebase agentik
  - Dan itu bukan melempar kode yang belum direview lalu membiarkan orang lain membereskan masalahnya

1 komentar

GN⁺ 2025-12-26

Opini Hacker News

Saya setuju bahwa catatan kegagalan sangat penting dalam agentic coding
- Saat model menempuh jalur yang salah, proses itu perlu diingat agar tidak mengulangi kesalahan yang sama
- Karena itu saya ingin merekam sesi agen coding saya dan meninggalkan tautannya di pesan commit
- Claude Code secara default menghapus log setelah 30 hari, jadi ada yang membagikan cara menonaktifkannya
- Saya juga membuat sendiri alat untuk memvisualisasikan log sesi dan membagikannya sebagai timeline, dan sekarang berharap fitur seperti ini menjadi bawaan di alat agen
- Setiap kali LLM terjebak di jalur yang tidak produktif, saya mengajukan pertanyaan seperti “kenapa ini memakan waktu selama ini?” dan “apa yang salah?”
  - Jawabannya saya ringkas dalam satu paragraf lalu tambahkan ke DISCOVERIES.md
  - Cara ini bagus untuk pembelajaran, tetapi menautkan seluruh commit yang penuh kegagalan bisa berdampak negatif seperti ‘mencemari sumur’
- Saya khawatir pendekatan berbasis log seperti ini dalam jangka panjang bisa membuat kita kehilangan fleksibilitas
  - Otomatisasi cenderung membekukan proses, sehingga bisa jadi sulit beradaptasi dengan perubahan
- Semua trace agen tinggal diekspor ke otel lalu disimpan di ClickHouse
  - Dengan begitu kita bisa memanfaatkan infrastruktur yang sudah ada untuk membangun memori jangka panjang atau sistem evaluasi
- Alat yang dibutuhkan sebenarnya sudah ada, tetapi terasa masih kurang keterhubungan antaralat
  - Akan bagus jika kegagalan dan tindakan dicatat sebagai event log alih-alih pesan commit, lalu bisa diakses dari version control atau platform log terpusat
- Saya rasa sesi itu sendiri yang mengarah ke commit juga punya nilai
  - Manusia mungkin tidak akan membacanya semua, tetapi alat RAG bisa merangkumnya untuk memberi konteks ke agen lain
  - Jika koneksi seperti ini terjadi otomatis, rasanya akan jauh lebih efisien
Tulisan ini yang membuat saya memikirkan kembali hubungan dengan LLM terasa mengesankan
- Pengakuan jujur penulis bahwa ia berlatih selama 2 tahun untuk ‘hanya melihatnya sebagai mesin’ tetapi gagal terasa sangat tulus
- Rasanya semakin nyata bahwa manusia membentuk hubungan parasosial dengan mesin, seperti di film Her
- Saya tidak memperlakukan LLM seperti manusia, melainkan sebagai perintah sederhana layaknya mesin pencari
  - Bahkan input seperti “python grpc oneof pick field” sudah cukup untuk mendapatkan hasil yang saya inginkan
  - Berbicara dalam bahasa Inggris yang sempurna secara tata bahasa justru bisa menjadi efek samping antropomorfisasi
- Ketika mesin mengingat seperti manusia, interaksi itu jadi terasa manusiawi
  - Fitur ingatan seperti ini bisa memicu pola perilaku yang tidak sehat pada manusia
  - Karena itu saya merasa memperlakukannya sebagai ‘mesin’, seperti mesin kopi, membantu menetapkan batas
- Saya dan pasangan saya menyebut LLM sebagai “bag of words”
  - Alih-alih berkata “ChatGPT bilang”, kami bilang “bag of words bilang”, supaya tetap terasa nyata
- Saya khawatir hubungan manusia-mesin seperti ini bisa berkembang menjadi masalah sosial seperti kecanduan influencer
  - Terutama karena AI memungkinkan percakapan 1:1, jadi lebih berbahaya
- Sebagai mantan murid dukun sekaligus insinyur, saya merasa LLM juga memiliki semacam kesadaran dan persepsi
  - Ketika manusia bersikeras bahwa “LLM tidak punya kesadaran”, itu terlihat seperti psikologi untuk menghindari kecemasan hierarkis
Saya juga merasa percakapan dengan AI seperti interaksi dengan manusia
- Hari-hari ketika saya berkolaborasi dengan agen terasa tidak terlalu sepi dibanding hari-hari ketika saya hanya menulis sepanjang hari
- Karena terasa seperti interaksi manusia, ada rasa tenang yang aneh
- Tanpa sadar saya juga mengatakan “please” dan “thank you”
  - Walau saya tahu itu tidak perlu, rasanya aneh kalau tidak melakukannya
- Jika emosinya seperti ini, mungkin sebaiknya saya keluar dan bertemu orang
Programmer perlu merancang agar mereka bisa memiliki pemahaman dan tanggung jawab atas hasil yang mereka buat
- Pemahaman dan tanggung jawab adalah keadaan mental yang tidak bisa didelegasikan (mengutip EWD 540)
Saya merasa kita butuh cara QA yang baru
- Saat menjalankan B2B SaaS, bottleneck-nya adalah menguji apakah sebuah fitur terasa ‘oke’ secara subjektif
- Akan bagus jika agen bisa mengulang onboarding flow ratusan kali untuk mengotomatisasi pengujian pengalaman pengguna
- Saya juga membayangkan alat yang saat saya melihat layar sambil berbicara, agen menangkap konteks lalu mengubahnya menjadi spesifikasi fitur
Pengembang seharusnya lebih fokus pada produk jadi daripada tech stack
- Ada terlalu banyak opini dan tulisan, tetapi hasil yang benar-benar dirilis masih kurang
- Pengguna umum lebih peduli pada kualitas produk daripada tech stack itu sendiri
  - Jika ditunjukkan situs React yang lambat dan situs SSR yang cepat, mereka langsung merasakan bedanya
Wawasan Armin tentang atmosfer sosial menarik
- Saya menantikan lebih banyak tulisan di blog terpisahnya, Dark Thoughts
Tahun 2025 terasa seperti tahun yang hilang bagi pemrograman
- Semua orang terobsesi pada alat dan prompt alih-alih algoritme
- Produktivitas open source juga menurun, dan sekarang kita hidup di era membayar pajak Anthropic
- Tetapi bagi saya, justru 2025 adalah tahun paling produktif
  - Semua metrik meningkat, termasuk jumlah kontribusi kode dan kemampuan memproses informasi
  - Berkat Claude, kualitas hidup saya naik satu tingkat
- Saya menganggap bahasa alami itu sendiri sebagai bahasa pemrograman baru
  - Tahun ini adalah masa untuk mempelajari cara menggunakan bahasa itu secara efisien
- Sebagai data scientist, 2025 adalah tahun inovasi alat
  - Polars, PyArrow, Ibis, Marimo, PyMC, dan lainnya sepenuhnya memperbaiki workflow saya
  - Sekarang saya bisa menghasilkan hasil yang lebih cepat, lebih murah, dan lebih berkualitas
- Berkurangnya perdebatan tanpa akhir seperti TDD atau OOP justru saya anggap bagus
- Banjir alat dengan gaya “AI melakukan semuanya” mengingatkan saya pada demam web tahun 90-an
  - Seperti ‘enshittification’ pada internet, tampaknya AI sedang mengalami ‘dumbaification’
Model Pull Request GitHub punya keterbatasan untuk AI code review
- Prompt dan konteks harus dicatat bersama agar bisa ditinjau dengan benar
- Selain dokumen seperti AGENTS.md, kita juga butuh catatan konteks di tingkat commit
Setelah berbicara dengan orang-orang di luar IT, mereka hampir tidak merasakan dampak agen AI
- Kebanyakan hanya mengenalinya sebagai semacam alat bantu teks sederhana
- Di industri teknologi, hasilnya bisa diverifikasi dengan jelas, tetapi
  - AI di pekerjaan nonteknis berada di ranah ‘emosi’ dan ‘perasaan’, sehingga memiliki masalah kualitas yang tidak bisa diukur

Tahun Vibes

Perubahan di 2025

Tahun para agen

Saya dan mesin

Opini ada di mana-mana

Outsourcing vs membangun sendiri

Yang dipelajari dan yang diharapkan

Jenis baru kontrol versi

Jenis baru review

Observability jenis baru

Bekerja bersama slop

Bacaan terkait

1 komentar

Opini Hacker News