Ekstensi workflow yang memaksa siklus pengembangan terstruktur pada agen coding Pi
(github.com/popododo0720)Akhir-akhir ini, berbagai alat agen coding AI bermunculan, dan pendekatan memodifikasi banyak file sekaligus dengan agen paralel sedang populer. Namun saat benar-benar digunakan, ada satu hal yang cepat terasa โ hasilnya berantakan.
Agen menumpahkan kode tanpa rencana, konsistensi antarmodul rusak, dan kesalahan yang sama terulang di setiap sesi. "Menghasilkan banyak dengan cepat" ternyata tidak selalu baik. Seberapa pun cepatnya laju generasi, kalau waktu yang dibutuhkan manusia untuk membereskan hasilnya justru lebih lama, itu jadi tidak berarti.
Karena itu, saya mengubah pendekatannya. Bagaimana jika kecepatan agen sengaja diperlambat, tetapi strukturnya dipaksakan, sehingga kualitas akhir meningkat?
Saya membuat ekstensi workflow untuk agen coding Pi (@mariozechner/pi-coding-agent), dan intinya adalah memaksa agen mengikuti siklus pengembangan 6 tahap berikut:
๐ Plan โ ๐ Verify Plan โ ๐จ Implement โ โ
Verify Impl โ ๐ง Compound โ ๐ Done
- Pemblokiran alat per tahap
Di luar tahap Implement, alat untuk memodifikasi file diblokir sepenuhnya. Perintah bash seperti rm, mv, sed -i juga diblokir pada tahap read-only. AI sama sekali tidak bisa menyentuh kode sebelum menyusun rencana. - Verifikasi adversarial multimodel paralel
Rencana dan hasil implementasi diverifikasi secara bersamaan oleh beberapa LLM. Ini bukan sekadar code review biasa, melainkan pendekatan menyerang dengan membuat skenario konkret yang dapat merusak kode. Tingkat keparahan diklasifikasikan sebagai ๐ด CRITICAL / ๐ก WARNING / ๐ต INFO, dan jika ada satu saja CRITICAL, tahap tersebut tidak bisa dilalui. - Pembelajaran Compound & memori proyek
Setiap kali satu siklus selesai, pola, kesalahan (gotchas), dan keputusan arsitektur dicatat secara otomatis. Memori ini disimpan di.pi/workflow-memory.json, sehingga tetap bertahan meski sesi berganti. Jadi, pendekatan seperti "kemarin kita tersandung di bagian ini, jadi hari ini jangan mengulanginya" menjadi mungkin. - Repo Map (AST + PageRank)
Denganweb-tree-sitter, simbol di seluruh proyek (fungsi, kelas, antarmuka, dll.) diekstrak, lalu grafik import dibuat untuk memberi bobot pentingnya tiap file menggunakan PageRank. Karena struktur proyek bisa dipahami dalam anggaran token (default 2048), agen dapat bekerja dalam keadaan sudah memahami "seperti apa bentuk proyek ini". Mendukung 18 bahasa.
Fitur lainnya
- Sistem TODO โ memecah task besar menjadi unit TODO, lalu menjalankan siklus Implement โ Verify โ Compound secara independen untuk tiap TODO
- Otomatisasi Git โ commit/push otomatis di setiap batas TODO, dan jika tree dalam keadaan dirty maka pembersihan dipaksa lebih dulu
- Pemeriksaan kustom โ jika menaruh file Markdown di
docs/checks/, kriteria verifikasi khusus proyek dapat ditambahkan - Manajemen konteks โ memisahkan konteks minimal yang selalu disuntikkan dan konteks on-demand yang diambil saat perlu, untuk mencegah pemborosan token
Filosofi
Bukan berarti agen paralel itu buruk. Hanya saja, menurut saya, generasi paralel tanpa struktur pada dasarnya sama saja dengan membuat utang teknis secara paralel. Ekstensi ini berangkat dari gagasan: "suruh AI bekerja, tetapi terapkan disiplin yang sama seperti cara manusia bekerja."
Ditulis 100% dalam TypeScript, dan dapat dipasang dengannpm install+ satu symlink.
GitHub: https://github.com/popododo0720/pi-stuff
Masukan sangat diterima!
Belum ada komentar.