oh-my-agent — harness agen IDE multi AI untuk penggunaan praktis

(github.com/first-fluke)

32 poin oleh gracefullight 2026-03-16 | 4 komentar | Bagikan ke WhatsApp

Kalau Anda berkata kepada agen, “tolong buatkan aplikasi TODO”, biasanya mereka memang akan membuat sesuatu. Masalahnya, mereka sering membuat hal yang melenceng, keluar dari cakupan, dan mengulangi kesalahan yang sama.

Untuk mengatasi masalah ini, pada awalnya banyak muncul pendekatan terstruktur seperti AGENTS.md, dan belakangan Skills. Namun jika melihat skill yang benar-benar dibagikan, ada beberapa masalah umum.

Informasi versi library yang paling penting tidak ada
Penjelasan peran berakhir sebagai deklarasi seperti "You are a Senior engineer"
Hal yang cukup dijelaskan dengan beberapa kata kunci justru ditulis bertele-tele sehingga membuang token

Akibatnya, skill seperti ini sering tidak bisa diikuti model dengan baik, hanya menghabiskan konteks, dan dalam jangka panjang mudah menjadi dead code yang tidak ingin dibuka lagi oleh siapa pun.

[Pendekatan]

Melalui oh-my-agent, saya ingin menyelesaikan masalah ini bukan dengan prompt, melainkan dengan proses. Saat agen melakukan pekerjaan dengan keliru, alih-alih sekadar berkata “coba lagi”, ada struktur yang mencatat mengapa itu salah dan merefleksikannya pada eksekusi berikutnya.

Salah satu mekanisme utamanya adalah penilaian Clarification Debt(CD). Jika agen salah memahami kebutuhan atau keluar dari cakupan, skornya akan terakumulasi.

clarify: +10 — pertanyaan konfirmasi sederhana
correct: +25 — koreksi arah karena salah memahami maksud
redo: +40 — rollback lalu mulai ulang karena keluar dari cakupan
Mulai bekerja tanpa memeriksa Charter: +15
Mengubah file di luar cakupan yang diizinkan: +20
Mengulangi error yang sama: x1.5 multiplier

Jika melewati 50 poin, penulisan Root Cause Analysis(RCA) menjadi wajib, dan jika melewati 80 poin, sesi dihentikan. Pelajaran yang didapat dari sini diakumulasikan ke lessons-learned.md dan langsung diterapkan mulai sesi berikutnya. Strukturnya dibuat agar meskipun prompt ditulis sederhana, prosesnya akan melakukan koreksi.

Selain itu, ada beberapa protokol umum agar agen tidak bergerak semaunya.

Clarification Protocol
Ambiguitas kebutuhan dibagi menjadi LOW / MEDIUM / HIGH. Jika LOW maka lanjut, jika MEDIUM maka tawarkan opsi, dan jika HIGH maka hentikan pekerjaan lalu lakukan klarifikasi.
Difficulty Guide
Tugas dibagi menjadi Simple / Medium / Complex, lalu kedalaman protokol yang dibutuhkan disesuaikan.
Context Budget
Anggaran token per model ditetapkan untuk mengurangi pemborosan konteks yang tidak perlu.

Pendekatan seperti ini juga sejalan dengan Harness Engineering yang dibicarakan OpenAI. Pemikiran dasarnya adalah bahwa persoalan menggunakan agen dengan baik bukanlah soal satu baris prompt, melainkan soal bagaimana mengendalikan agen dengan struktur tertentu.

[Struktur proyek]

oh-my-agent mengelola hal ini di dalam struktur proyek.

.agents/ = SSOT
Skill, workflow, dan konfigurasi dikumpulkan di bawah .agents/ untuk digunakan sebagai single source of truth. Tidak terikat pada IDE tertentu.
Tim agen berbasis peran
Selain peran dasar seperti PM, QA, Frontend, Backend, Mobile, dan Debug, kali ini juga ditambahkan DB Agent dan TF Infra Agent.
- DB Agent: pemodelan SQL / NoSQL / Vector DB, termasuk rekomendasi keamanan ISO 27001
- TF Infra Agent: Terraform multi-cloud, kebijakan OPA / Sentinel, termasuk panduan kontrol seri ISO 42000
Orkestrasi berpusat pada workflow
Perencanaan, review, debug, dan eksekusi paralel dijadikan alur dasar. Workflow /brainstorm yang baru ditambahkan mengeksplorasi desain terlebih dahulu tanpa menulis kode.
Prosesnya berjalan dengan urutan analisis codebase → pertanyaan klarifikasi → usulan pendekatan → persetujuan pengguna → penyimpanan dokumen desain, lalu dilanjutkan ke /plan → implementasi.

[Dua mode orkestrasi]

/coordinate adalah pendekatan menjalankan dengan cepat lalu memperbaiki jika muncul masalah. PM memecah tugas, menjalankan agen, lalu QA melakukan satu kali review. Jika muncul isu CRITICAL/HIGH, pekerjaan tersebut dijalankan ulang. Secara keseluruhan, ini adalah loop 7 tahap yang ringan dan cepat.

Sebaliknya, /ultrawork menempatkan verifikasi kualitas secara ketat. Ini dibagi menjadi lima tahap: PLAN → IMPL → VERIFY → REFINE → SHIP, dan setiap tahap memiliki gate sehingga jika tidak lolos, proses tidak bisa lanjut ke tahap berikutnya. 11 dari 17 tahap adalah review, dan pada tahap REFINE juga dilakukan pemecahan file, penghapusan duplikasi, analisis efek samping, hingga pembersihan dead code.

Mungkin terlihat agak berlebihan, tetapi saya rasa banyak yang akan sepakat bahwa ketika level abstraksi pemrograman meningkat dari bahasa mesin → bahasa pemrograman → bahasa alami, pada akhirnya verifikasi menjadi hal yang paling penting.

[Latar belakang perluasan proyek]

Sebulan lalu, ini diperkenalkan sebagai orkestrator khusus Antigravity bernama oh-my-ag. Namun selama waktu itu, beberapa AI IDE mulai menggunakan .agents/skills/ sebagai jalur skill proyek, sehingga tidak ada lagi alasan untuk membatasinya pada IDE tertentu. Karena itu, proyek ini diperluas menjadi bentuk harness umum dan menjadi oh-my-agent.

[Memulai]

curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/… | bash

Mendukung semua AI IDE utama seperti Antigravity, Claude Code, Codex CLI, dan Cursor.

Jika Anda sudah menggunakan AI IDE, mungkin layak dicoba sekali. Pada akhirnya, tujuan developer adalah mencapai QCD (Quality, Cost, Delivery) secara bersamaan. Proyek ini dibuat dengan pemikiran bahwa pengembangan agen juga bukan pengecualian.

🔗 GitHub: first-fluke/oh-my-agent

4 komentar

findme 2026-03-16

Saya sudah lama menjadi pengguna, jadi ini kabar yang menyenangkan. Saya cukup puas menggunakan coordinate
Kebetulan saya juga berharap bisa melakukan verifikasi lebih jauh, dan kalau mode ultra memang lebih teliti, sepertinya besok saya harus langsung mencobanya.

gracefullight 2026-03-16

Terima kasih! Kalau ada yang kurang nurut, tolong beri tahu ya.

moon5g 2026-03-17

Saat menambahkan skrip di package.json, entah bagaimana hanya folder workspace yang tersisa dan semua file lainnya malah terhapus. Sedang saya pulihkan, tapi ini benar-benar bikin melongo.

gracefullight 2026-03-17

Apakah Anda menjalankannya di dalam Claude atau di dalam agen? Tidak ada kode yang menghapus package.json atau semua file. Kami akan berterima kasih jika Anda bisa membagikan seluruh alurnya!

tarball.ts:33,35,43 — hanya menghapus direktori sementara /tmp/oh-my-agent-*
cleanup.ts:108,231 — file PID, hanya dijalankan lewat perintah oma cleanup yang eksplisit
agent.ts:665,1027 — file PID/log (saat proses berakhir)
skills.ts:234 — 1 symlink di dalam .cursor/skills
migrate.ts:45-80 — direktori symlink .cursor/skills lama

oh-my-agent — harness agen IDE multi AI untuk penggunaan praktis

Bacaan terkait

4 komentar