NambaAI - Alat CLI yang merapikan pekerjaan Codex ke alur SPEC, validasi, dan handoff PR
(github.com/Nam-Cheol)Saat menggunakan Codex, saya merasa kurang nyaman dengan alur ketika permintaan yang ambigu langsung berujung pada perubahan kode, sehingga saya sedang membuat alat CLI yang merapikan ini menjadi prosedur pengembangan yang lebih terstruktur.
NambaAI bukan alat untuk menggantikan Codex, melainkan lebih dekat ke lapisan workflow yang berjalan di sekitar Codex.
Ide dasarnya adalah sebagai berikut.
request → SPEC → execution → validation → PR handoff
Artinya, alih-alih langsung meneruskan permintaan pengguna ke implementasi, alat ini membantu lebih dulu merapikan tujuan, cakupan, batasan, dan kriteria penerimaan, menyimpannya sebagai file SPEC, lalu melanjutkan pekerjaan.
Saat ini, alat ini disusun terutama di sekitar alur berikut.
namba project
namba plan "permintaan pekerjaan"
namba run SPEC-XXX
namba sync
namba pr
namba land
Saya juga sedang bereksperimen dengan alur queue untuk memproses beberapa SPEC secara berurutan.
Alasan saya membuat alat ini adalah karena semakin praktis AI coding, semakin sering proses perubahan menjadi sulit dilacak, atau belakangan sulit memastikan berdasarkan kriteria apa sesuatu diimplementasikan. Terutama saat menggunakan Codex berulang kali, saya merasa hal-hal seperti “apa yang disepakati untuk dikerjakan”, “sampai mana batas cakupannya”, “bagaimana validasinya dilakukan”, dan “apa yang harus dilihat di PR” bisa menjadi kabur.
NambaAI adalah upaya untuk mengurangi masalah ini dengan cara berikut.
- Merapikan tujuan dan cakupan terlebih dahulu sebelum mulai bekerja
- Membuat file SPEC sebelum implementasi
- Mencatat hasil eksekusi dan evidence validasi
- Membuat dokumen handoff PR
- Merapikan perubahan yang dibuat Codex agar mudah direview manusia
- Mengelolanya sebagai proses pengembangan yang bisa diulang, bukan prompt sekali pakai
Arahnya bukan untuk membuat autonomous agent serbaguna seperti framework AI agent yang sudah ada. Saat ini fokusnya adalah menempatkan Codex di pusat alur, lalu memecah pekerjaan ke unit yang bisa ditinjau developer dan didokumentasikan.
Karena masih tahap awal, tentu masih banyak kekurangannya.
- Contoh penggunaan nyata masih kurang
- Dokumen onboarding perlu diperbaiki
- eval pack masih kurang
- Perlu tinjauan keamanan untuk installer/hook
- Perlu pengujian lintas macOS, Linux, dan Windows
- Perbandingan dengan AI coding harness yang ada masih kurang
- Validasi di proyek nyata masih kurang
Ini adalah proyek open source awal yang saya buat sendiri, dan saat ini lebih merupakan tahap memvalidasi arah ketimbang produk yang sudah matang.
Bagi yang menggunakan Codex di pekerjaan nyata atau proyek pribadi, saya terutama ingin mendapatkan masukan tentang hal-hal berikut.
- Apakah workflow Codex berbasis SPEC seperti ini tampak berguna dalam proses pengembangan nyata
- Bagian mana yang terlihat terlalu banyak dirancang
- Jika ingin diterapkan di proyek nyata, mekanisme kepercayaan apa lagi yang diperlukan
- Apakah ada alat atau pola yang sudah ada dan layak dijadikan perbandingan
- Apakah ada bagian dalam alur instalasi/penggunaan yang terasa tidak nyaman atau terlihat berisiko
Pendapat yang kritis juga tidak masalah. Karena ini masih tahap awal, untuk sekarang mengetahui bagian mana yang benar-benar lemah lebih membantu daripada sekadar mendapat komentar positif.
1 komentar
Saya membuatnya dengan tujuan sebagai CLI, tetapi belakangan ini saya menggunakannya di Codex desktop! Saya sempat khawatir akan bentrok dengan harness bawaan Codex desktop, tetapi syukurlah kompatibilitasnya sangat mulus, haha.
Selain itu, saya juga perlu menyesuaikan isi pembaruan Codex 0.131.0 kali ini, dan karena saya hanya menggunakan harness ini, bagian-bagian yang masih kurang juga terus terlihat, tetapi yang paling kurang tetap tenaga saya sendiri...