37 poin oleh GN⁺ 14 hari lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Pergeseran kini sedang berlangsung pada 2026 dari cara berkolaborasi dengan satu asisten AI dalam loop sinkron ke model orkestrator, tempat banyak agen bekerja secara asinkron dengan jendela konteks dan cakupan file masing-masing
  • Tiga pola inti—Subagents, Agent Teams, dan delegasi hierarkis—membentuk struktur dasar coding multiagen, masing-masing memberi efek paralelisme, spesialisasi, isolasi, dan pembelajaran majemuk
  • Daftar tugas bersama dan pesan peer-to-peer menjadi mekanisme koordinasi inti bagi agent team, memungkinkan pelepasan dependensi secara otomatis dan pencegahan bottleneck
  • Per 2026, ekosistem alat dibagi menjadi tiga lapisan: subagent in-process (Tier 1), orkestrator lokal (Tier 2), dan agen asinkron cloud (Tier 3), dan sebagian besar developer mencampur ketiganya sesuai kebutuhan
  • Bottleneck telah bergeser dari pembuatan kode ke verifikasi (Verification), dan quality gate melalui persetujuan rencana, hooks, serta AGENTS.md bersama review manusia menjadi faktor kunci yang menentukan keandalan sistem multiagen

Transisi saat ini: dari conductor ke orchestrator

  • Hingga 6 bulan lalu, sebagian besar developer bekerja secara sinkron dengan satu asisten AI, dan satu jendela konteks menjadi batas atas pekerjaan
  • Kini, developer yang paling produktif beralih ke cara kerja yang mengoordinasikan banyak agen secara asinkron, masing-masing dengan jendela konteks, cakupan file, dan area tanggung jawabnya sendiri
  • Model Conductor: memandu satu agen secara sinkron dan real-time; alat perwakilannya adalah Claude Code CLI dan mode agen di editor Cursor
  • Model Orchestrator: mengoordinasikan banyak agen secara asinkron, masing-masing dengan jendela konteksnya sendiri; alat perwakilannya adalah Agent Teams, Conductor, Codex, dan Copilot Coding Agent
  • Sebagai orchestrator, dibutuhkan kemampuan baru untuk menulis spesifikasi yang jelas, memecah pekerjaan, dan memverifikasi hasil

8 tahap coding berbantuan AI

  • [Orkestrasi]
    • L8 — Membangun orchestrator sendiri: mengimplementasikan sendiri lapisan koordinasi dengan menulis kode untuk pembuatan, routing, dan pengelolaan agen
    • L7 — 10+ agen, dikelola manual: “Aduh, ini berantakan.” Konteks yang salah dikirim ke agen yang salah, dan pertanyaan “Bagaimana kalau Claude Code menjalankan Claude Code?” mulai muncul
    • L6 — Multiplexing agen: karena bosan menunggu, mulai menjalankan agen satu per satu lebih banyak, lalu berpindah-pindah di antara banyak stream hingga tak bisa berhenti
  • [Agent-first]
    • L5 — Agent-first, IDE belakangan: percakapan dengan agen menjadi ruang kerja utama, IDE dipakai untuk memeriksa kode
    • L4 — diff menghilang dan percakapan memimpin: tidak lagi meninjau diff setiap saat, melainkan mengamati tindakan agen dan fokus memberi arahan
  • [Era IDE]
    • L3 — Mode YOLO: agen berjalan bebas di IDE, kepercayaan meningkat
    • L2 — Agen di dalam IDE, persetujuan izin manual: semua perubahan file disetujui langsung, kontrol sepenuhnya manual
    • L1 — Tanpa AI: workflow development tradisional
  • Berdasarkan kerangka 8 tahap pemanfaatan alat AI yang dirangkum Steve Yegge, sebagian besar developer masih berada di level 3–4
  • Lapisan orkestrasi dimulai dari level 6, dan menuntut skillset yang secara mendasar berbeda dari kemampuan yang dibangun hingga level 5
  • Pembahasan ini mencakup level 5–8

Batasan agen tunggal

  • Kelebihan beban konteks: satu agen memiliki batas jumlah informasi yang bisa ditampung, dan codebase skala besar melampaui satu jendela konteks
  • Tidak ada spesialisasi: agen yang menangani data layer, API, UI, dan testing sekaligus hanyalah generalis, sedangkan agen yang khusus menangani data layer menulis kode DB jauh lebih baik
  • Tidak ada koordinasi: bahkan jika helper agent ditambahkan, mereka tidak bisa saling berkomunikasi, berbagi tugas, atau menyelesaikan dependensi, dan tanpa primitive koordinasi, makin banyak agen justru makin sulit dikelola
  • Subagent menyelesaikan dua masalah pertama, sementara agent team menyelesaikan ketiganya

Mengapa multiagen

  • Paralelisme (throughput 3x): agen frontend, backend, dan testing bekerja secara bersamaan
  • Spesialisasi (konteks terfokus): setiap agen hanya mengenali file yang menjadi tanggung jawabnya; agen yang hanya tahu db.js menulis kode DB lebih baik daripada agen yang menangani seluruh codebase
  • Isolasi (eksekusi aman): Git worktree memberi direktori kerja terpisah untuk tiap agen, tanpa konflik merge
  • Pembelajaran majemuk: file AGENTS.md mengakumulasi pola dan catatan penting lintas sesi sehingga setiap sesi memperbaiki sesi berikutnya
  • Tiga agen yang fokus secara konsisten memberikan hasil lebih baik daripada satu agen generalis yang bekerja tiga kali lebih lama

Pola 1: subagent — delegasi terfokus

  • Gunakan alat Task untuk membuat child agent yang terspesialisasi dari orchestrator induk; ini adalah pola multiagen paling sederhana dan layak dicoba lebih dulu
  • Contoh konkret: jika Claude Code diberi prompt “bangun bookmark manager Link Shelf dengan Express dan SQLite”, orchestrator induk memecahnya menjadi tiga brief subagent
    • Subagent data layer: membangun db.js lalu menulis laporan DATA.md
    • Subagent business logic: membangun validation.js lalu menulis laporan LOGIC.md
    • Subagent API route: membaca DATA.md dan LOGIC.md, lalu membangun server.js
  • Dua subagent pertama berjalan paralel secara independen, dan yang ketiga dimulai setelah dua laporan selesai; induk mengelola graf dependensi secara manual
  • Batasan subagent: induk harus mengelola graf dependensi secara manual, tidak ada pesan peer antaragennya maupun daftar tugas bersama; jika pengelolaan cakupan file longgar, konflik bisa terjadi
  • Total biaya berada di kisaran netral, sekitar 220 ribu token
  • Subagent hierarkis (team of teams)

    • Alih-alih orchestrator membuat langsung 6 subagent, strukturnya adalah membuat 2 feature lead, dan tiap feature lead secara mandiri membuat 2–3 spesialis
    • Orchestrator induk hanya mengelola dua agen sehingga konteks tetap rapi; feature lead A menerima brief “bangun fitur pencarian” lalu memecahnya sendiri
    • Prinsipnya sama dengan cara organisasi engineering nyata beroperasi: VP tidak menetapkan tugas langsung ke engineer individual, melainkan menyampaikannya lewat tech lead

Pola 2: Tim Agen — Eksekusi Paralel Sejati

  • Fitur eksperimental Claude Code, diaktifkan dengan perintah export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
  • Arsitektur 3 lapis:
    • Team Lead: memecah pekerjaan, membuat daftar tugas, merangkum hasil
    • Daftar tugas bersama: status (pending, in_progress, completed, blocked) · pelacakan dependensi · penguncian file
    • Rekan tim: masing-masing instance Claude Code yang independen, memiliki context window sendiri, berjalan di panel terpisah tmux
  • Rekan tim secara mandiri memilih tugas dari daftar bersama, dan berkomunikasi langsung lewat peer-to-peer messaging (tanpa melalui lead)
  • Setelah satu rekan tim menandai tugas sebagai selesai, tugas terblokir yang bergantung padanya akan otomatis dibuka
  • Dapat menyalakan/mematikan overlay visual daftar tugas dengan Ctrl+T
  • Mekanisme inti tim agen

    • Daftar tugas bersama: ketika rekan tim backend menandai Search API sebagai selesai, tugas penulisan test yang sebelumnya terblokir otomatis berubah ke status pending; penguncian file mencegah pengeditan serentak
    • Peer messaging: agen backend langsung menyampaikan kontrak API ke agen frontend — "GET /search?q= returns [{id,title,url}]"; mencegah lead menjadi bottleneck koordinasi
    • Saat rekan tim menjadi idle, lead otomatis diberi tahu
  • Rekomendasi utama tim agen

    • 3–5 rekan tim adalah titik optimal; biaya token meningkat linear sebanding dengan ukuran tim
    • Persetujuan rencana: jika rekan tim menulis rencana sebelum implementasi, lead meninjau dan menyetujui atau menolaknya; menemukan masalah arsitektur sebelum kode ada jauh lebih murah
    • Tiga rekan tim yang fokus secara konsisten menghasilkan performa lebih baik daripada lima rekan tim yang terdistraksi
  • Tip keandalan tim agen

    • Loop guardrail + tahap refleksi: tetapkan batas atas MAX_ITERATIONS=8 untuk semua rekan tim; sebelum setiap percobaan ulang, paksa prompt refleksi "apa yang gagal? perubahan konkret apa yang akan memperbaikinya? apakah pendekatan yang sama sedang diulang?" → secara drastis mengurangi kemunculan agen yang buntu
    • Rekan tim @reviewer khusus: tetapkan Claude Opus 4.6 (read-only) sebagai reviewer, hanya menggunakan alat lint, test, dan security scan, dipicu otomatis pada setiap event TaskCompleted; rasio 1 reviewer untuk setiap 3–4 builder; lead selalu hanya menerima kode yang sudah selesai ditinjau

Pola 3: Orkestrasi dalam skala besar

  • Saat mengelola 5, 10, 20, atau lebih agen di banyak repo dan fitur, dibutuhkan alat orkestrasi khusus
  • Tier 1 — Subagen dan tim in-process: subagent Claude Code dan tim agen; satu sesi terminal, tidak memerlukan alat tambahan; mulai dari sini
  • Tier 2 — Orkestrator lokal: menjalankan banyak agen di worktree terpisah, sambil mempertahankan dashboard, review diff, dan kontrol merge; optimal untuk 3–10 agen pada codebase yang sudah dikenal; Conductor, Vibe Kanban, Gastown, OpenClaw + Antfarm, Claude Squad, Antigravity, Cursor Background Agents
  • Tier 3 — Agen asinkron di cloud: model penugasan task lalu menutup laptop dan menunggu PR; berjalan di cloud VM; Claude Code Web, GitHub Copilot Coding Agent, Jules by Google, Codex Web by OpenAI
  • Pada 2026, sebagian besar developer akan memakai ketiga lapisan: Tier 1 (pekerjaan interaktif), Tier 2 (sprint paralel), Tier 3 (pemrosesan backlog semalaman)

Sorotan alat

  • Conductor by Melty Labs

    • Cara tercepat memulai orkestrasi multiagen di Mac; menjalankan banyak agen Claude Code dan Codex secara paralel masing-masing di git worktree yang independen
    • Menyediakan dashboard visual dan UI review yang memprioritaskan diff; hanya menanggung biaya API (gratis); khusus macOS (Apple Silicon dan Intel)
    • Paling cocok saat mengerjakan 3–8 fitur secara paralel di repo yang sama dan membutuhkan pengawasan visual
  • Claude Code Web

    • Diakses dari claude.ai/code; sepenuhnya berbasis browser, tanpa terminal; hubungkan repo GitHub lalu masukkan deskripsi tugas → berjalan di cloud VM yang dikelola Anthropic
    • Mendukung steering di tengah jalan, pembuatan PR otomatis, dan akses lewat aplikasi iOS
    • Tim (terminal) adalah cara bekerja bersama agen, sedangkan Web (browser) adalah cara mendelegasikan lalu meninggalkan prosesnya
  • GitHub Copilot Coding Agent

    • Berbeda dari mode agent Copilot di IDE (sinkron dan interaktif); Copilot Coding Agent milik GitHub sepenuhnya asinkron
    • Tetapkan issue GitHub apa pun ke @copilot atau mulai dari panel Agents → menghasilkan draft PR di lingkungan GitHub Actions
    • Menjalankan loop review sendiri sebelum pemberian tag; agen pihak ketiga seperti Claude Code dan Codex juga bisa diakses dari panel yang sama; dapat dipicu dari Slack, Jira, Linear, Azure Boards
  • Jules by Google

    • Agen coding cloud asinkron dari Google, berbasis Gemini; hubungkan repo GitHub → deskripsi tugas → Jules membuat rencana → setelah disetujui berjalan di cloud VM → mengembalikan PR yang mencakup seluruh proses penalaran dan log terminal
    • Menyediakan Jules Tools CLI untuk changelog audio, menghentikan task di tengah jalan, dan menyalurkan issue GitHub secara langsung
    • Otomatis membaca AGENTS.md di repo tanpa konfigurasi tambahan
  • OpenAI Codex Web

    • Setiap task berjalan di kontainer sandbox terpisah dengan repo GitHub yang sudah dimuat sebelumnya
    • Memiliki ekosistem surface yang menghubungkan Web, CLI (open-source), aplikasi macOS, ekstensi IDE, dan integrasi GitHub ke akun ChatGPT
    • Fitur Verifiable Evidence: untuk setiap task, mengembalikan kutipan log terminal dan output test sehingga riwayat eksekusi bisa diaudit
  • Cursor Cloud Agents + Glass

    • Agen bisa dijalankan dari web, aplikasi desktop, Slack, Linear, GitHub, API, PWA (instal dari cursor.com/agents)
    • Glass: antarmuka baru Cursor yang menjadikan manajemen agen sebagai layar utama, sementara editor lama berubah menjadi alat pendukung yang diakses saat diperlukan
    • Mencerminkan pola di seluruh ekosistem bahwa control plane menjadi pengalaman utama dan editor menjadi satu instrumen di bawahnya
  • Vibe Kanban

    • Menyelesaikan "doomscrolling gap" (jeda 2–5 menit saat agen bekerja); buat kartu tugas lalu tarik ke "In Progress" untuk membuat worktree dan branch masing-masing
    • Diff bisa direview di dalam board dan umpan balik dapat dikirim ke agen yang sedang berjalan; mendukung Claude Code, Codex, Gemini CLI, Amp, Cursor Agent CLI, dan lainnya; lintas platform (Mac, Windows, Linux), gratis, BYOK

Tips untuk meningkatkan skala

  • Routing multi-model

    • Tidak semua tugas membutuhkan model yang paling mahal; buat file MODEL_ROUTING.md untuk routing per peran:
      • Perencanaan·arsitektur → model Gemini/Claude/OpenAI yang lebih murah
      • Implementasi → Sonnet, Opus, atau Codex
      • Review → model keamanan khusus
  • Skrip siklus hidup worktree

    • Otomatiskan pekerjaan berulang dengan tiga alias shell:
      • agent-spin <feature>: buat worktree + branch + mulai agen
      • agent-merge <feature>: rebase + review + buat PR
      • agent-clean: hapus worktree yang sudah selesai
    • Sekitar 12 baris bash; Conductor menangani ini secara visual
  • Hanya izinkan AGENTS.md yang ditulis manusia

    • Penelitian ETH Zurich oleh Gloaguen dkk. menemukan bahwa file AGENTS.md yang dihasilkan LLM tidak memberi manfaat, bahkan menyebabkan penurunan tingkat keberhasilan rata-rata ~3% dan peningkatan biaya inferensi lebih dari 20%
    • File konteks yang ditulis developer memberikan peningkatan performa ~4%
    • Jangan pernah mengizinkan agen menulis langsung ke AGENTS.md; lead harus menyetujui setiap baris
    • Jaga tetap ringkas dengan bagian yang jelas: STYLE, GOTCHAS, ARCH_DECISIONS, TEST_STRATEGY

Gerbang kualitas: percaya, tapi verifikasi

  • Tiga gerbang kualitas

    • Persetujuan rencana: anggota tim menulis rencana sebelum mulai coding → lead meninjau·menyetujui atau menolak → implementasi; biaya memperbaiki rencana yang buruk jauh lebih murah daripada memperbaiki kode yang buruk
    • Hooks: pemeriksaan otomatis pada event siklus hidup; hook TeammateIdle memeriksa apakah semua tes lolos sebelum agen berhenti bekerja; hook TaskCompleted menjalankan lint·tes sebelum ditandai selesai; jika hook gagal, agen terus bekerja sampai lolos
    • Pembelajaran majemuk melalui AGENTS.md: menangkap pola·catatan kehati-hatian·preferensi gaya yang ditemukan; semua agen membacanya saat memulai sesi dan isinya bertambah di setiap sesi
  • Bottleneck bergeser ke verifikasi

    • Agen dapat menghasilkan output yang mengesankan dengan kecepatan luar biasa; bagian yang sulit adalah memastikan output itu benar
    • Tes yang lolos sebelum perubahan tidak menjamin akan menangkap regresi yang disebabkan perubahan
    • Agen dapat menulis tes yang valid secara teknis tetapi melewatkan kasus penting
    • Karena batas context window, agen yang bekerja pada codebase besar bisa melewatkan batasan penting di luar tampilan saat ini
    • Lingkungan yang tidak stabil, yang bagi satu developer hanyalah edge case yang menjengkelkan, menjadi blocker sistemik ketika 40 agen menghadapi tes tidak stabil yang sama secara bersamaan
    • Sampai infrastruktur verifikasi mampu menyamai kemampuan generasi, review manusia adalah sistem keselamatan, bukan biaya tambahan opsional

Ralph Loop dan agen yang memperbaiki diri

  • Pola Ralph Loop

    • Dipopulerkan oleh Geoffrey Huntley dan Ryan Carson; pola di balik “shipping while you sleep”; tool mandiri Carson ralph (snarktank/ralph) mengimplementasikan loop inti, sementara proyek Antfarm menambahkan orkestrasi multiagen di atas OpenClaw
    • Siklus 5 langkah: Pick(pilih tugas berikutnya dari tasks.json) → Implement(lakukan perubahan) → Validate(jalankan tes·tipe·lint) → Commit(commit jika pemeriksaan lolos dan perbarui status tugas) → Reset(reset konteks agen lalu lanjut ke tugas berikutnya)
    • Insight utamanya: reset pada setiap iterasi mencegah akumulasi kebingungan; tugas yang kecil dan jelas cakupannya menghasilkan lebih sedikit halusinasi dan kode yang lebih rapi dibanding satu prompt raksasa
    • Pengaman: kirim error sebagai feedback untuk retry otomatis, tetapi hentikan dan tugaskan ulang jika deadlock lebih dari 3 kali; selalu bekerja di feature branch; tetapkan batas iterasi·waktu·token; agen membuat PR → review manusia sebelum merge
    • Pertahankan 4 saluran memori di antara reset konteks: riwayat commit git, log progres, file status tugas (tasks.json), dan AGENTS.md sebagai memori semantik jangka panjang
  • Membuat agen makin pintar seiring waktu

    • Refleksi diri melalui REFLECTION.md: setelah setiap tugas, wajibkan penulisan “apa yang mengejutkan, satu pola untuk ditambahkan ke AGENTS.md, satu perbaikan prompt”; lead meninjau lalu menggabungkan pembelajaran yang disetujui
    • Anggaran token dan kriteria penghentian: tetapkan batas per agen (misalnya frontend 180 ribu token, backend 280 ribu token); jeda otomatis di 85% anggaran dan beri tahu lead; hentikan jika deadlock pada error yang sama lebih dari 3 kali lalu tugaskan ke agen baru
    • Beads / memori permanen: pola “beads” dari Gastown — catatan immutable berbasis git untuk setiap keputusan dan hasil beserta asal-usul lengkapnya; agen mencari beads lama melalui task graph dan data plane yang dapat dialamati dengan SQL; ini adalah memori institusional yang terstruktur dan bisa di-query, bukan RAG berbasis vektor sederhana

Disiplin yang membuat semua ini berjalan

  • Bottleneck manusia ternyata bukan bug, melainkan fitur

    • Saat menulis kode dengan kecepatan manusia, rasa sakit muncul lebih awal; tes gagal, catatan dari code review, duplikasi ditemukan — rasa sakit itu langsung terasa sehingga diperbaiki sambil jalan
    • Dalam pasukan agen yang terorkestrasi, tidak ada bottleneck alami; kesalahan kecil (bau kode, duplikasi, abstraksi yang tidak perlu) bertambah secara majemuk dengan kecepatan yang mustahil dikejar
    • Karena Anda keluar dari loop, Anda tidak merasakan sakit sampai arsitektur tidak lagi memungkinkan fitur baru
    • Semua gerbang kualitas (persetujuan rencana, hook, anggaran token, review manusia) ada karena alasan ini: tanpa itu, coding oleh agen akan membawa Anda sendiri ke jalan buntu
  • Delegasikan tugas, tapi pertahankan penilaian

    • Yang sebaiknya diserahkan ke agen: tugas dengan cakupan jelas dan kriteria lulus/gagal yang jelas, boilerplate, migrasi, scaffolding tes, eksplorasi pendekatan yang Anda tidak punya waktu untuk mencobanya sendiri
    • Yang harus tetap Anda pegang: arsitektur dan desain API (agen belajar banyak arsitektur buruk dari data latih dan bisa menerapkan pola enterprise mentah-mentah ke startup), memutuskan apa yang tidak akan dibangun (mengatakan Tidak adalah kemampuan yang tidak dimiliki agen), review output agen dengan konteks sistem secara utuh
    • Jika Anda kehilangan pemahaman atas sistem Anda sendiri, Anda kehilangan kemampuan untuk memperbaiki·memperluas·mendeteksi malfungsi
  • Spesifikasi adalah leverage

    • Saat mengorkestrasi 50 agen secara paralel, pemikiran yang ambigu bukan hanya memperlambat, tetapi diperbesar ke seluruh puluhan eksekusi paralel
    • Perbedaan antara output biasa-biasa saja dan output luar biasa hampir sepenuhnya bergantung pada kualitas spesifikasi
    • Spesifikasi yang ambigu memperbesar error ke seluruh armada; spesifikasi presisi dengan arsitektur·batas integrasi·edge case·invariant yang jelas diperbesar menjadi implementasi presisi di seluruh sistem
    • Pekerjaan mekanis mengetik kode sedang diotomatisasi; pekerjaan kognitif memahami sistem akan diperbesar ke seluruh armada pekerja otonom

Model pabrik

  • Kita tidak lagi sekadar menulis kode, melainkan memasuki tahap membangun pabrik yang membuat software
  • Lini produksi 6 langkah: Plan(tulis spesifikasi dengan kriteria penerimaan) → Spawn(bentuk tim dan tugaskan agen) → Monitor(cek progres setiap 5–10 menit·selesaikan blocker, jangan hover) → Verify(jalankan tes·review kode; verifikasi adalah bottleneck) → Integrate(merge branch·selesaikan konflik) → Retro(perbarui AGENTS.md dengan pola baru; pembelajaran majemuk)
  • Tips praktis:
    • Tetapkan batas WIP: jangan jalankan lebih banyak agen daripada yang bisa Anda review secara bermakna; 3–5 adalah titik optimal
    • Definisikan kriteria penghentian: hentikan dan tugaskan ulang jika deadlock pada error yang sama lebih dari 3 kali
    • Check-in asinkron: cek progres setiap 5–10 menit; biarkan agen bekerja secara otonom
    • Satu pemilik per file: jangan biarkan dua agen mengedit file yang sama; konflik membunuh kecepatan

5 pola untuk mulai hari ini

  1. Urai menjadi subagen: Buat agen turunan yang fokus dengan brief spesifik dan kepemilikan file menggunakan alat Task; tidak perlu konfigurasi; mulai hari ini
  2. Paralelisme dengan tim agen: Aktifkan CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1; buat 1 pemimpin + 3 anggota tim; koordinasikan dengan daftar tugas bersama
  3. Isolasi dengan Git worktree: Berikan worktree sendiri untuk tiap agen; tanpa konflik merge; Conductor menanganinya secara otomatis
  4. Gerbang kualitas untuk kepercayaan: Wajibkan persetujuan rencana untuk perubahan berisiko; tambahkan hook yang menjalankan pengujian saat tugas selesai; jangan percaya output agen tanpa verifikasi
  5. Pembelajaran majemuk dengan AGENTS.md: Dokumentasikan pola, hal-hal yang perlu diperhatikan, dan preferensi gaya; dibaca dan diperbarui setiap sesi; pengetahuan bertambah secara majemuk

Belum ada komentar.

Belum ada komentar.