Perang Framework Claude Code
(shmck.substack.com)- Pengembang kini berada pada tahap mempelajari cara berkolaborasi dengan AI, dan nilai Claude dimaksimalkan saat digunakan bukan sebagai chatbot sederhana melainkan sebagai framework
- Di komunitas, berbagai upaya terus dilakukan untuk menyusun dan memanfaatkan Claude, hingga eksperimennya begitu aktif sampai layak disebut Claude Code Framework Wars
- Dari sini, terbentuk arus pemanfaatan Claude dalam berbagai peran seperti manajer proyek, arsitek, pengembang, dan reviewer
- Dalam merancang framework, ada 8 keputusan utama yang diperlukan, termasuk manajemen tugas, pemberian panduan, kolaborasi agen, operasi sesi, akses tool, pengembangan kode, delivery, dan pelestarian konteks
- Pelajaran utamanya adalah AI bukan menggantikan pengembang, melainkan menjadi rekan kerja yang melipatgandakan produktivitas melalui aturan dan peran yang terstruktur
Pendahuluan
- Ide inti: menganggap Claude bukan sebagai alat percakapan biasa, melainkan sebagai framework, sehingga hasil yang dihasilkan menjadi lebih dapat diprediksi dan bernilai lewat aturan serta alur kerja yang jelas
- Pengembang beralih dari coding ke peran bernilai tambah tinggi (manajemen proyek, desain, arsitektur)
- Framework Claude Code berjalan dengan prompt terstruktur tanpa perlu menulis kode
- Perang framework Claude Code: komunitas pengembang sedang bereksperimen dengan berbagai pendekatan untuk penggunaan AI yang produktif
- Puluhan proyek open source saling bersaing sambil mendefinisikan alur kerja dan struktur peran
- Contoh: Agent OS, Claude-Flow
Pilihan utama yang perlu dipertimbangkan saat merancang framework
1. Lokasi manajemen tugas
- Perlu mendefinisikan sumber tugas yang dapat dirujuk Claude
- Markdown backlog: mengelola tugas sebagai daftar todo berformat Markdown
- Contoh: Backlog.md, ReqText
- Teks terstruktur: mengubah spesifikasi produk menjadi tugas
- Contoh: Agent OS
- Issue/tiket: menyimpan spesifikasi di GitHub Issues atau tiket Jira, lalu menghubungkannya ke code review
- Contoh: ccpm
- Markdown backlog: mengelola tugas sebagai daftar todo berformat Markdown
- Intinya: tugas harus disimpan di lokasi yang bisa diakses dan dilacak oleh Claude
2. Cara memberikan panduan ke Claude
- Berikan instruksi kepada Claude dengan struktur yang jelas, bukan prompt yang ambigu
- Pustaka perintah: slash command yang telah didefinisikan seperti
/create-tasks,/review - Standar coding: menjelaskan tech stack dan pedoman coding
- Definisi selesai: mengodekan kriteria selesai sebuah tugas
- Hook validasi pemicu: memaksa linting dan testing untuk semua perubahan
- Claude reviewer: Claude menangani pengembangan dan review sekaligus
- Pustaka perintah: slash command yang telah didefinisikan seperti
- Intinya: aturan yang jelas dan dapat diulang meningkatkan kualitas kerja Claude
3. Struktur kolaborasi agen
- Saat menggunakan banyak agen Claude, koordinasikan dengan peran dan perencanaan
- Simulasi peran: AI menjalankan peran PM, arsitek, pengembang, dan tester
- Contoh: Agent OS
- Pemrosesan swarm paralel: banyak agen dijalankan bersamaan dalam alur terstruktur dari spesifikasi → pseudocode → kode → pengujian
- Contoh: Claude-Flow
- Artifact native repository: menyimpan tugas, log, dan catatan keputusan (ADR) di codebase untuk mempertahankan memori
- Contoh: Roo Commander
- Simulasi peran: AI menjalankan peran PM, arsitek, pengembang, dan tester
- Intinya: koordinasi mencegah benturan antar banyak pekerja AI
4. Cara mengoperasikan sesi
- Tetapkan sesi sebagai lingkungan kerja untuk mencegah keluaran AI menjadi kacau
- Orkestrasi terminal: Claude mengendalikan perintah, jendela, dan log
- Contoh: Symphony, Claude-Squad
- Worktree paralel: menjalankan banyak branch secara paralel dengan Git Worktrees
- Contoh: Crystal
- Container paralel: menjalankan Claude dalam container terpisah untuk mencegah benturan
- Contoh: ClaudeBox
- Orkestrasi terminal: Claude mengendalikan perintah, jendela, dan log
- Intinya: kerja paralel memaksimalkan produktivitas tanpa benturan
4. Cara menjalankan sesi
- Tetapkan sesi sebagai lingkungan kerja untuk mencegah keluaran AI menjadi kacau
- Orkestrasi terminal: Claude mengendalikan perintah, jendela, dan log
- Contoh: Symphony, Claude-Squad
- Worktree paralel: menjalankan banyak branch secara paralel dengan Git Worktrees
- Contoh: Crystal
- Container paralel: menjalankan Claude dalam container terpisah untuk mencegah benturan
- Contoh: ClaudeBox
- Orkestrasi terminal: Claude mengendalikan perintah, jendela, dan log
- Intinya: kerja paralel memaksimalkan produktivitas tanpa benturan
5. Akses tool untuk Claude
- Atur agar Claude dapat memanfaatkan pengetahuan di seluruh tech stack
- Integrasi MCP: menghubungkan browser, database, test runner, dan framework otomasi UI
- Pustaka tool kustom: dibangun dengan shell script dan command
- Contoh: Symphony
- Akses database: tool akses database yang kuat
- Contoh: Claudable with Supabase
- Hook testing dan validasi: menjalankan pengujian dengan Vitest, Jest, dan lainnya sebelum tugas dianggap selesai
- Contoh: Agent OS
- Intinya: integrasi tool mengubah Claude dari autocomplete sederhana menjadi anggota tim yang aktif
6. Cara mengembangkan kode
- Claude dapat menjalankan berbagai peran sesuai kebutuhan
- Manajer proyek (PM): mengubah spesifikasi produk menjadi tugas dan backlog
- Arsitek: merancang struktur keseluruhan, mendefinisikan antarmuka, dan menetapkan aturan sebelum coding
- Implementer: menulis kode sesuai testing dan standar
- QA: meninjau masalah pada tugas
- Contoh: BMAD-code
- Reviewer: mengaudit kualitas PR, keterbacaan, dan risiko
- Intinya: memanfaatkan AI di seluruh siklus hidup perangkat lunak
7. Cara delivery kode
- Definisikan cara kode mencapai repository
- Intinya: pilih iterasi aman untuk produksi atau scaffold untuk prototipe
8. Cara mempertahankan konteks
- Selesaikan masalah mudah lupa pada Claude dengan memori framework
- Dokumen dan jurnal: memperbarui CLAUDE.md, catatan arsitektur, dan jurnal proyek
- Contoh: Claude Conductor
- Memori persisten dan pemeriksaan: ringkasan pekerjaan terbaru, pemeriksaan kesehatan proyek, dan penyimpanan keputusan
- Contoh: Claude-Flow
- Dokumen dan jurnal: memperbarui CLAUDE.md, catatan arsitektur, dan jurnal proyek
- Intinya: tanpa memori AI mengulang kesalahan; dengan memori, kemajuan menjadi lebih kompleks dan berkelanjutan
Cara menggabungkannya
- Anggap pilihan-pilihan ini sebagai menu, jadi tidak perlu menerapkan semuanya sekaligus
- Konfigurasi pemula: markdown backlog + perbedaan berbasis tiket
- Tim terstruktur: spesifikasi produk + standar + simulasi peran
- Berfokus pada eksperimen: artifact repository + sesi paralel
- Mode prototipe: app builder + scaffold dokumentasi
Kesimpulan dan implikasi
- Pelajaran utama: Claude memberikan hasil terbaik dalam lingkungan yang terstruktur
- Bukan menggantikan peran pengembang, tetapi mengurangi pekerjaan boilerplate sehingga fokus bisa dialihkan ke definisi spesifikasi, review desain, dan penentuan arsitektur
- Jika tugas salah arah, proses bisa cepat melenceng, sehingga pengelolaan yang terstruktur sangat penting
- Saat ini masih tahap awal, tetapi framework mendorong AI untuk tidak diperlakukan sebagai kotak ajaib, melainkan sebagai kumpulan anggota tim yang dapat dikelola
- Semakin banyak struktur yang diberikan, semakin besar nilai yang dikembalikan
- Melalui proyek open source, komunitas bereksperimen dengan berbagai framework untuk mencari cara menggunakan AI secara produktif
- Pengembang dapat memanfaatkan Claude secara sistematis untuk fokus pada pekerjaan bernilai tambah tinggi, sekaligus mengintegrasikan AI sebagai anggota tim demi memaksimalkan produktivitas
1 komentar
Opini Hacker News
Sudah mencoba beberapa "framework" untuk Claude Code, tetapi secara objektif tidak yakin performanya benar-benar membaik
Rasanya cuma penuh ritual yang mengelilingi proses rumit seolah-olah itu formula resmi, dan saya jadi bertanya-tanya sebenarnya karena apa
Pendekatan framework seperti ini terasa tidak selaras dengan tujuan pelatihan model
Pada praktiknya, ini seperti melemparkan informasi yang tidak perlu ke model sambil memaksa konteks tercemar agar sesuai dengan "proses yang saya tetapkan"
Menurut saya yang penting adalah menghilangkan pencemaran konteks, hanya memberi informasi yang benar-benar dibutuhkan untuk pekerjaan nyata, lalu memperbaikinya secara bertahap
Cara kolaborasi tradisional seperti ini lebih cocok jika dilakukan di luar konteks agen yang punya batas konteks
Tulisan ini sama sekali tidak menyebut subagents, jadi saya penasaran kapan ini ditulis
Saya mendelegasikan tugas seperti "mengambil hanya informasi yang relevan untuk pekerjaan saat ini dari memory bank" dan "menjalankan test lalu hanya memberi umpan balik tentang kegagalan dan coverage" ke subagent
Dengan begitu saya bisa mencegah konteks agen utama cepat penuh
https://docs.anthropic.com/en/docs/claude-code/sub-agents
Hidup jadi jauh lebih mudah setelah mengadopsi beberapa praktik praktis seperti dev containers dan worktrees
Saya juga membuat sendiri "framework" shell script untuk mengelola file proyek dan membuat worktree, dan pekerjaan itu selesai hanya dalam sekitar dua hari
Karena tidak terikat pada tool tertentu, rasanya lebih bebas
Saya setuju bahwa pencemaran konteks adalah kenyataan yang memang harus diperhatikan
Khususnya setelah mengalami definisi endpoint MCP memakan porsi besar dari konteks saya sendiri, sekitar 20 ribu token, saya selalu mempertimbangkan isu konteks saat memilih MCP
Rasanya mirip situasi project manager sungguhan
Yang saya inginkan adalah penggunaan Claude yang memasukkan tahap bertanya dulu soal bagian yang belum jelas saat menyusun proposal
Kalau kita hanya memberi requirement dan hasil yang diharapkan ke engineer sungguhan, tentu mereka akan mengajukan pertanyaan tambahan sebelum eksekusi untuk memastikan kesesuaian
Saya berharap Claude juga bisa mengotomatisasi proses klarifikasi seperti itu
Saya cukup sering melihat banyak kesalahan muncul karena pertanyaan yang belum diperjelas sama sekali tidak dipertimbangkan
Saat menerapkan framework seperti ini, saya penasaran seberapa besar otonomi yang benar-benar diberikan, dan di lingkungan seperti apa framework ini dipakai, greenfield atau brownfield
Saya juga ingin bertanya apakah ada yang pernah memakai Claude Code pada software enterprise dan benar-benar percaya diri dengan hasilnya
Di kantor saya punya akses yang cukup bebas ke Claude Code, tetapi di codebase saya sendiri hasilnya naik turun kalau sudah melibatkan frontend UI atau Playwright
Saya penasaran dengan kiat pemakaian nyata seperti seberapa banyak code junk yang tertinggal, bagaimana tingkat kelelahan kolaborasi dengan rekan kerja, ukuran pull request, biaya inferensi, dan cara mengelolanya saat diparalelkan
Dokumen README kadang terasa seperti materi promosi untuk dijual karena penuh istilah spesifik sistem, emoji, dan cara merapikan toolbox yang terlalu dipersonalisasi
Pada akhirnya saya rasa Anthropic dan lainnya akan memasukkan fitur-fitur ini langsung ke CLI mereka sendiri
Secara pribadi, saya membiarkan reasoning model menangani semuanya sekaligus: spesifikasi 10 halaman, lint/type check/formatter/hook yang ketat, checklist pekerjaan, sampai red/green TDD, lalu cukup sekali bilang “go” ke GPT-5 dan hasil yang dibutuhkan akan dibuat otomatis
Kalau punya tool yang sama, siapa pun bisa dengan mudah membangun sistem versinya sendiri
Saya memakai paket Max $200, jadi biaya inferensi juga tetap
Khususnya pada situasi greenfield seperti penambahan fitur baru, hasilnya sangat jelas terasa
Untuk refactor kompleks atau perubahan mendalam pada sistem, progresnya juga cukup baik jika ada dokumen desain yang bagus, tetapi di area yang dokumentasinya kurang, efektivitasnya tidak terlalu keluar
Di awal banyak muncul "kode yang kurang bagus"—implementasi dengan style, reusability, atau maintainability yang lemah—tetapi setelah memperkuat file
CLAUDE.mddan membuat persona developer wajib selalu memakai subagentelixir-code-reviewer, kualitas kode meningkat secara nyataPlatform kami open source, jadi konfigurasi Claude command dan subagent yang sekarang kami pakai dibagikan di sini
https://github.com/Simon-Initiative/oli-torus/tree/master/.claude
Saya merasakan gaya khas LLM sangat kuat dalam blog itu
Informasinya berguna, tetapi lucu juga rasanya belajar tentang AI dari AI
Akhir-akhir ini banyak tulisan tentang AI yang terasa seperti itu
Pada praktiknya, kecuali pekerjaannya memang tidak butuh keahlian tinggi, Claude Code tetap harus dimonitor langsung dan segera disela kalau mulai bergerak ke arah yang salah
Dari sisi keamanan juga kita tidak bisa memberinya terlalu banyak izin atau tidak memeriksa perintah apa yang sebenarnya dijalankan
"Framework" saat ini masih sangat jauh jalannya, dan untuk sekarang paling realistis menganggapnya sebagai “intern junior yang memuntahkan kode dengan kecepatan luar biasa”
Bisa jadi penulisnya tidak benar-benar memeriksa repo dengan baik, atau memang hasil risetnya terbatas
Misalnya, superClaude bukan MCP server, dan metaGPT tampaknya tidak kompatibel dengan Claude Code
Saya selalu penasaran kenapa agent, seperti manusia, tidak dibiarkan mengelola konteksnya sendiri
Saya tidak mengerti kenapa seluruh riwayat pekerjaan sebelumnya harus selalu dimasukkan setiap kali
Kalau agent dibiarkan menilai konteks mana yang perlu dipertahankan agar efektif, lalu belajar sendiri kelebihan dan kekurangan pengelolaan konteks, rasanya kemampuan menyelesaikan tiap tugas akan jadi lebih baik
Pada akhirnya, sepertinya textbook "bitter lesson" terulang juga di sini
Orang-orang membangun bermacam-macam "framework", tetapi generasi model berikutnya membuat semuanya jadi tidak berguna
http://www.incompleteideas.net/IncIdeas/BitterLesson.html
Saya cukup terkejut BMAD-method tidak disebutkan
Dari pengalaman saya, BMAD-method adalah pelengkap terbaik untuk Claude Code
Saya penasaran apa itu BMAD-method
Saya ingin tahu apakah itu sekadar setingkat system prompt, dan apa yang membuatnya terasa begitu berguna
https://github.com/bmad-code-org/BMAD-METHOD
Sistem BMAD tampak mirip AgentOS yang diperkenalkan di postingan itu
Pendekatan context engineering seperti ini efektif bagi saya, dan saya bahkan membiarkan Claude sendiri membuat command dan agent, lalu menyesuaikannya sesuai kebutuhan
Belakangan saya juga aktif memakai json dan markdown untuk berbagi context
taskmaster juga begitu, tetapi tidak ada di daftar
Pengelolaan context terasa seperti low-level programming
Menurut saya ini mirip harus memasukkan nilai yang tepat ke register CPU agar operasi yang benar bisa dijalankan
Bedanya, untuk tiap tugas kita punya kontrol yang jauh lebih sedikit atas context apa yang bisa ditambahkan atau dihapus
Setelah mencoba B-MAD Framework, hasilnya sangat berbeda sampai sekarang saya merasa tidak bisa bekerja tanpa tool ini
Saya berharap akan muncul lebih banyak framework seperti ini ke depannya
Saya penasaran apakah ada yang benar-benar sudah memakai framework seperti ini
Apakah memang memberi hasil nyata, atau cuma hype yang sedang ikut tren
Hasilnya sesuai dugaan: fitur bertebaran tanpa validasi, dokumentasi yang layak tidak ada, dan isinya penuh Claude-isms
Pada akhirnya, itu cuma cukup layak dipakai untuk segelintir proyek yang memang diminati pembuatnya