15 poin oleh GN⁺ 2026-01-25 | 1 komentar | Bagikan ke WhatsApp
  • Swarms adalah fitur orkestrasi multi-agent yang sudah ada di dalam Claude Code tetapi belum dipublikasikan
  • Pengguna tidak lagi berbicara dengan satu AI coder, melainkan berinteraksi dengan AI yang berperan sebagai team lead
  • Team lead tidak menulis kode secara langsung, tetapi menyusun rencana, membagi tugas, dan menggabungkan hasil, lalu mendelegasikan peran ke agent bawahan
  • Setelah rencana disetujui, agent pekerja yang terspesialisasi berjalan secara paralel dan menangani implementasi nyata
  • Ini menunjukkan arah perluasan Claude Code dari sekadar satu alat menjadi proses pengembangan berbasis tim

Cara kerja

  • Saat pengguna menyetujui rencana, sistem beralih ke Delegation Mode
  • Beberapa agent pekerja spesialis dibuat dan bekerja secara paralel
  • Setiap pekerja menangani tugas implementasi nyata seperti penulisan kode, analisis, dan perbaikan
  • Koordinasi progres dan dependensi dilakukan melalui pesan antar-pekerja
  • Semua hasil dikumpulkan ke team lead lalu dikembalikan sebagai respons akhir

Alat claude-sneakpeek

  • Repo claude-sneakpeek menyediakan build paralel Claude Code dengan feature flag yang terbuka
  • Fitur yang belum dipublikasikan, termasuk mode Swarms, dapat dicoba dalam lingkungan yang sepenuhnya terpisah dari instalasi Claude Code yang ada
    • Menggunakan konfigurasi, sesi, server MCP, dan kredensial terpisah
  • Tersedia fitur tambahan yang sudah tertanam di Claude Code tetapi belum dirilis secara publik
    • Dukungan eksekusi multi-agent native melalui Swarm mode
    • Pembuatan agent latar belakang melalui Delegate mode
    • Menyediakan fitur messaging antar-anggota tim dan pengelolaan kepemilikan tugas
  • Dukungan model dan penyedia terpisah
    • Mendukung Z.ai, MiniMax, dan OpenRouter, serta memungkinkan integrasi model lokal melalui cc-mirror

1 komentar

 
GN⁺ 2026-01-25
Komentar Hacker News
  • Sejujurnya ini mungkin terdengar gila, tapi aku pernah mendapatkan kode dengan kualitas tertinggi seperti ini
    Biayanya sekitar 10 kali lebih mahal, tetapi aku membuat satu instance Opus mengelola seluruh “tim proyek” yang terdiri dari beberapa sub-agent
    Pekerjaannya adalah mem-porting server Java lawas ke C# .NET 10, dan aku memakai 9 agen, Kanban 7 tahap, serta struktur Git Worktree yang terpisah
    Setiap perannya seperti berikut —
    Manager (Claude Opus 4.5): event loop global yang membangunkan agen sesuai status Kanban
    Product Owner (Claude Opus 4.5): menangani strategi, mencegah scope creep
    Scrum Master (Opus 4.5): memprioritaskan backlog dan menetapkan tiket
    Architect (Sonnet 4.5): fokus pada desain, tidak melakukan implementasi
    Archaeologist (Grok-Free): hanya membaca dekompilasi Java lawas saat diperlukan
    CAB (Opus 4.5): gatekeeper yang menolak fitur pada tahap desain dan kode
    Dev Pair (Sonnet 4.5 + Haiku 4.5): loop AD-TDD, Junior menulis tes yang gagal, Senior memperbaikinya
    Librarian (Gemini 2.5): mengelola dokumentasi dan memicu retrospektif
    Sejujurnya kalau ditanya “apa ini benar-benar perlu?”, jawabannya mungkin “tidak”, tapi melihat agen AI berkolaborasi itu sangat menyenangkan
    Versi awal prosesnya ada di gambar ini

    • Aku penasaran apakah kamu bisa membagikan detail teknisnya
      Apakah ini murni berbasis prompt, plugin, atau struktur yang memanggilnya berulang kali lewat skrip
      Aku juga penasaran Kanban-nya berada di mana
    • Aku juga memakai struktur yang mirip dengan ini
      Bentuknya terdiri dari satu koordinator dan beberapa agen spesialis seperti ahli backend, frontend, dan DB
      Kuncinya adalah koordinator. Itu mengurangi beban kognitifku dan melacak progres keseluruhan dengan baik
    • Secara umum Scrum Master tidak menetapkan tiket secara langsung
    • Menurutku langkah berikutnya adalah menjadikan apa yang kamu buat sebagai layanan
      Seperti ungkapan “saya tidak ingin bicara dengan monyet, saya ingin bicara dengan pemain organ”, awalnya mungkin dimulai dari wawancara dengan manajer dan program manager, lalu setelah itu mereka berjalan sendiri dan kita hanya meminta demo serta update. Lucu juga
    • Aku penasaran apakah ini sindiran atau serius
  • Sebenarnya ini memanfaatkan fitur sub-agent yang sudah tertanam di Claude
    Tidak perlu membuat sesuatu seperti abstraksi tmux 300 ribu baris dalam Go
    Cukup suruh Claude menjalankan pekerjaan paralel dengan sub-agent di background
    Sebaiknya sediakan file untuk meneruskan prompt, melacak progres, dan pelaporan, serta disarankan membatasi tiap agen ke worktree terpisah
    Aku sedang merangkum pola ini di workforest.space
    Kebanyakan orang membuat orkestrator terpisah, padahal sebenarnya Claude sendiri adalah orkestrator terbaik

    • Ini bukan sekadar sub-agent biasa
      Perbedaannya dengan alat-alat yang sudah ada adalah abstraksinya berbasis unit kerja, bukan unit percakapan
      Claude Code dibatasi oleh fokus berbasis percakapan karena masalah aplikasi pihak ketiga, tetapi Claude Code Web untuk pertama kalinya memperluas itu
      Pendekatan ini membuat AI mengoordinasikan pekerjaannya sendiri, sehingga pengguna tidak perlu terus melempar prompt
      Ini rumit, tetapi sedang berevolusi menjadi struktur di mana AI mengelola AI lain
    • Sebenarnya ini bukan fitur baru, melainkan membuat sub-agent yang sudah dimiliki Claude dipakai dalam implementasi nyata
      Hanya saja detail perencanaannya masih kurang, jadi reliabilitasnya masih rendah
    • Ini berbeda dari sub-agent yang ada
      Agen utama beralih ke mode konteks yang berpusat pada delegasi, dan terintegrasi dengan sistem tugas berbasis tim serta sistem mailbox
      Tingkat integrasinya tidak bisa dicapai lewat plugin
    • Berkat visualisasi “stacked PR”, aku langsung memahami konsepnya
      Aku biasanya menumpuk commit seperti PR lalu merapikannya dengan rebase, dan itu cukup menyakitkan
      Sekarang sepertinya aku bisa memperbaikinya dengan membagi branch menjadi 2~3, meminimalkan konflik, dan mengelolanya seperti itu
    • Aku juga menempatkan instance Claude utama sebagai manajer, lalu membiarkannya mengelola agen-agen implementasi
      Itu membantu menjaga konteks tetap rapi sambil menghasilkan keluaran berkualitas tinggi
  • Aku ingin kode berkembang ke arah yang lebih singkat dan berkualitas lebih tinggi
    Tapi alur saat ini tampaknya bergerak ke arah sebaliknya
    Kalau model menjadi lebih kokoh, akal sehat dan loop umpan balik diperkuat, ini tentu akan berguna, tetapi untuk sekarang justru memperbesar masalah dengan pola “semakin banyak kode semakin baik”
    Demo yang keren memang mungkin, tetapi di lingkungan produksi nyata rasanya akan menjadi kode yang 10~100 kali lebih kompleks

    • Aku juga punya pengalaman serupa
      Saat aku menyuruh Claude menambahkan statistik cakupan tes ke CI, karena nyc belum terpasang, dia malah mencoba mengimplementasikan ulang Istanbul dengan bash
      Pada akhirnya aku harus bilang “tinggal instal nyc saja”
    • Karena fitur ini belum dirilis, sepertinya Anthropic juga menilai modelnya belum cukup siap
      Meski begitu, eksperimen seperti ini tampaknya akan membantu mendorong batas kemampuan model
      Mungkin bukan sekarang, tapi sekitar 2026 barangkali sudah memungkinkan
  • Akan bagus kalau di HN ada voting berkala untuk menelusuri peringkat popularitas agen coding AI
    Seperti TIOBE Index per bahasa, aku ingin melihat tren model mana yang sedang populer

    • Tinggal pilih saja yang kamu suka dan pakai
      Persaingan peringkat pada akhirnya cuma siklus hype yang berputar
    • Aku baru saja memulai survei serupa. Silakan ikut → agentic-coding-survey.pages.dev
    • Ini bukan opini komunitas, tapi aku sering merujuk ke leaderboard lmarena
      Menarik bahwa MiniMax 2.1 berada di atas sebagian besar GPT
      Di openrouter.ai kita juga bisa kira-kira melihat throughput dan biaya modelnya
    • Aku mengikuti perkembangan terbaru lewat newsletter milik Zvi Mowshowitz
      Berkat itu, aku menjadikan Opus 4.5 sebagai utama hanya seminggu setelah rilis
    • Skill agent buatanku masuk 10 besar di direktori skills.sh
      Sekitar 80% basis penggunanya memakai Claude Code, dan 75% berada di lingkungan darwin-arm64
  • Claude menghasilkan terlalu banyak kode sehingga sulit direview
    Ada yang bilang “asal semua tes lolos sudah cukup”, tapi untuk proyek jangka panjang yang harus dipelihara, itu terasa mengkhawatirkan
    Aku penasaran dengan pengalaman orang-orang yang pernah mencoba generasi kode gaya YOLO pada proyek operasi jangka panjang

    • Di lingkungan profesional nyata, menangani satu agen pada satu waktu saja sudah cukup
      Kualitas kodenya masih rendah, dan debugging juga sering salah
      Meski begitu, itu tetap berguna untuk pencarian, pemahaman, dan perluasan ide
      Kalau hanya proyek eksperimen pribadi, pendekatan YOLO juga tidak masalah
    • Aku bekerja di Graphite/Cursor, tetapi kalau CC diminta mengelola perubahan dalam bentuk stack lalu dipasangi agen review otomatis, perubahan berskala besar jadi lebih mudah dipahami
      Dengan begitu pembuatan kode bisa diotomatisasi sambil tetap mempertahankan pemahaman terhadap sistem
    • Saat Claude Code menulis kode, aku menyuruhnya mereview commit terakhir dengan skill “codex-review” buatanku
      Aku meminta Codex mengusulkan poin-poin review, lalu memverifikasi akurasinya dalam review yang sebenarnya
    • Sekarang masih terlalu dini untuk melihat hasilnya, tetapi menjelang akhir tahun ini kita mungkin akan melihat proyek-proyek seperti kastel yang dibangun di atas pasir menghasilkan seperti apa
  • Ada kalimat, “Sekarang ini bukan bicara dengan AI coder, melainkan dengan team lead,”
    tapi lucunya bahkan tweet itu sendiri terasa seperti ditulis oleh AI

    • Betul, ungkapan retoris seperti ini terlalu sering diulang oleh AI
  • Pada 2026, orkestrator agen tampaknya akan menjadi tren utama
    Memakai istilah software yang sudah ada seperti team lead, anggota tim, dan sebagainya akan meningkatkan pemahaman dan penerimaan

    • Setuju. Konsep kompleks seperti Gas Town hanyalah jalan memutar untuk mengoreksi perilaku model yang abnormal
      Kalau Anthropic bisa mengoordinasikan model mereka sendiri, lapisan seperti itu akan menjadi tidak perlu
      Pada akhirnya yang penting adalah messaging dan manajemen tugas
    • Tapi menurutku konsep seperti Polecats membantu mencegah antropomorfisasi yang berlebihan
  • Kalimat “Kepada team lead dan seluruh tim, buat tombol ini menjadi merah” itu lucu

    • “Principal engineer! Butuh arsitektur! Tim marketing, iklan selebritas! Tim produk, roadmap! Tim ML, masukkan data pelatihan! Tim keuangan, hitung ROI! Tim operasi, cover 24/7!”
      Pada akhirnya kesimpulannya adalah “Baik, sekarang buat tombolnya merah!” Sindiran yang sempurna
    • Walaupun Claude sebenarnya bisa melakukan ini hanya dengan prompt, kita tidak akan mengakui bahwa itu sudah cukup
      Kalau melihat video ini, rasanya langsung terasa
    • System prompt bawaan sudah dibuat agar bisa menilai dengan baik kapan harus memakai mode swarm
      Jika memberi instruksi tambahan di CLAUDE.md, itu juga bisa disetel agar tidak memakai mode swarm untuk tugas-tugas sepele
  • Di versi 2.1.9 terbaru, cara main loop mengorkestrasi sub-agent benar-benar berubah total
    Muncul log seperti “FTSChunkManager agent masih berjalan tetapi sedang ada progres, jadi mari tunggu”, beserta stack trace dan output JSON

  • Aku melihat perilaku seperti ini langsung di aplikasi desktop Claude Code
    Di bawah master task ada banyak agen worker leader yang menjelajahi codebase, menulis laporan, dan membuat daftar TODO
    Sistem lain lalu menggabungkan itu menjadi skema dan rencana master
    Aku membuat chat devops, frontend, architecture, dan security secara terpisah, lalu setiap kali satu chat selesai, ia meninggalkan log dan saling bertukar pembaruan
    Jika disambungkan ke droplet lewat SSH agar bisa memakai terminal, Claude akan berulang kali membangun, memperbaiki, menguji, dan memverifikasi sendiri
    Dengan cara ini aku menyelesaikan proyek ini hanya dalam 3 hari

    • Sebenarnya ini hanya fungsi dasar yang menjalankan beberapa agen eksplorasi paralel lalu menggabungkan hasilnya
    • Sangat mirip dengan cara kerja oh-my-opencode