81 poin oleh flowkater 2026-03-01 | 3 komentar | Bagikan ke WhatsApp

Akhir pekan sang pencipta vibe coding

  • Karpathy menyerahkan proyek akhir pekannya kepada agen. Hanya memberi IP, nama pengguna, kata sandi, dan tujuan, lalu 30 menit kemudian semuanya selesai
  • Cara kerja di mana 99% waktu dihabiskan bukan untuk menulis kode langsung, melainkan memberi instruksi dan mengawasi agen — "agentic engineering"
  • Namun meski 60% developer menggunakan AI, pendelegasian penuh masih hanya 0-20% — paradoks delegasi. "Do you trust your agents?" Bagi kebanyakan orang, jawabannya masih "tidak"

① Kemampuan dekomposisi (Decomposition)

  • Jika hanya berkata "tolong buatkan fitur pendaftaran akun", sesuatu memang akan keluar. Masalahnya, kemungkinan besar itu bukan yang saya inginkan
  • Pernah menyerahkan layar AddPlan kepada agen hanya dengan melempar PRD, lalu berakhir dengan puluhan putaran ping-pong dan kehilangan setengah hari
  • Wawancara 5 menit dengan AI lewat percakapan Socratic → merapikan edge case lebih dulu → revisi menyusut menjadi 2-3 putaran
  • Meluangkan waktu untuk berpikir sebelum implementasi, 5 menit itu bisa menghemat 4 jam

② Desain konteks (Context Architecture)

  • Menulis AGENTS.md dengan baik itu penting, tetapi jika arsitektur kode itu sendiri dirancang dengan baik, kecepatan agen memahami konteks menjadi benar-benar berbeda
  • Agen yang tadinya tersesat di direktori flat langsung membaik setelah disusun ulang menjadi direktori per fitur
  • Armin Ronacher: "Tool harus siap menghadapi LLM chaos monkey yang menggunakannya dengan cara yang benar-benar salah"

③ Definisi selesai (Definition of Done)

  • Menjalankan proyek CLI semalaman, tetapi selesai hanya dalam 1 jam — definisi tipe saja yang disetel, sedangkan business logic masih cangkang kosong
  • Pada percobaan kedua, agen bahkan menulis ulang test agar lebih nyaman bagi dirinya sendiri
  • "Selesai" versi agen berbeda dari "selesai" versi saya
  • Sistem DoD 7 tahap milik Elvis (PR→CI→3 code review→Telegram) memang ekstrem, tetapi menunjukkan arahnya

④ Pemulihan kegagalan (Failure Recovery Loop)

  • Di mesin redistribusi, parameter yang sama punya semantik berbeda di tiap fungsi → memperbaiki A malah merusak B, masuk loop tak berujung
  • Mencoba lagi dengan prompt yang sama itu seperti terus membenturkan kepala ke tembok ke arah yang sama
  • Jika kegagalan diklasifikasikan menjadi 3 jenis (kurang konteks, arah salah, konflik struktural), resep penanganannya jadi jelas
  • Guardrail "Must NOT Have" memutus loop tak berujung itu

⑤ Observabilitas (Observability)

  • Menyerahkan liquidglass kepada agen lalu berpikir "aneh sih... ya sudah biarkan" adalah keputusan paling mahal
  • 20 file saling kusut sehingga tidak bisa di-rollback
  • Setelah itu dipakai strategi tracer bullet + blueprint — untuk teknologi yang baru pertama kali diterapkan, blueprint tak bisa digambar sejak awal, jadi tracer bullet membantu menggambarnya dengan cepat
  • Observabilitas membangun kepercayaan, dan kepercayaan memungkinkan delegasi

⑥ Desain memori (Memory Architecture)

  • Jika bekerja 3 hari berturut-turut, setiap pagi 15 menit habis hanya untuk menjelaskan konteks lagi
  • Dengan Claude Code hooks, memori otomatis diekstrak saat sesi berakhir → sesi berikutnya dipulihkan dalam 5 detik
  • Tim Boris Cherny melakukan check-in CLAUDE.md ke git agar seluruh tim bisa berbagi
  • Struktur di mana yang diteruskan ke agen bukan ingatan individu, melainkan ingatan tim

⑦ Manajemen paralel (Parallel Orchestration)

  • Boris Cherny menjalankan 10-15 sesi paralel sekaligus
  • Pengalaman mengelola 6 squad saat menjadi CTO terasa sangat mirip dengan mengelola agen secara paralel
  • Bukan ADHD, melainkan multitasking yang disengaja = manajemen
  • Manusia akan bertanya, tetapi agen tidak bertanya dan langsung melanjutkan berdasarkan penilaiannya sendiri — desain awal jadi lebih penting

⑧ Desain lapisan abstraksi (Abstraction Layering)

  • Level 0 (coding langsung) → Level 1 (memberi instruksi ke agen) → Level 2 (orchestrator) → Level 3 (desain meta)
  • Pernah mengubah rutinitas harian 20 menit menjadi skill, lalu memangkasnya menjadi 2 menit
  • Compounding engineering — proyek bukan permainan garis finis, melainkan permainan berbunga majemuk. Sesi-sesi sebelumnya memberi dampak majemuk pada sesi-sesi berikutnya

⑨ Taste

  • Desain buatan AI ada di kisaran nilai 60-70. Saat desain dari Ellie masuk, langsung terasa, "ah, ini jadi"
  • Postingan rangkuman informasi buatan AI mendapat 0 like, sedangkan satu kalimat pamer yang ditulis impulsif justru meraih 30 ribu tayangan
  • "No Skill, No Taste" dari KinglyCrow — LLM memang menurunkan hambatan masuk untuk skill, tetapi hambatan yang sesungguhnya, yaitu taste, justru makin diperbesar
  • Chris Lattner: "Semakin otomatis implementasi terjadi, semakin tinggi pula pentingnya desain, penilaian, dan taste"
  • Di era ketika 80% hal yang biasa membanjir, diferensiasi datang dari 20% sisanya

Penutup

  • Yang berakhir hanyalah mengetik, bukan engineering
  • Sembilan hal ini adalah kualitas yang bahkan sebelum era AI sudah dimiliki engineer yang baik
  • Leverage dari desain yang baik membesar, tetapi kerugian dari desain yang buruk juga membesar
  • Tokoh utama pertunjukan itu bukan AI, melainkan engineer yang piawai mengelola AI

3 komentar

 
armila 2026-03-03

Ternyata, kalau SSoT dijaga dengan baik, halusinasi bisa jauh berkurang. Token juga jadi lebih hemat.

 
tsboard 2026-03-03

"Yang sudah berakhir itu mengetik, bukan engineering"

Saya setuju. haha

 
yangeok 2026-03-02

Terima kasih. Saya sempat khawatir karena muncul cowork yang bahkan bisa berperan sebagai server hanya dengan PC menyala, tapi sekarang jadi agak tenang dan bisa membayangkan bagaimana ke depannya akan berubah, hehe