127 poin oleh xguru 22 hari lalu | 6 komentar | Bagikan ke WhatsApp
  • "Tolong susunkan harness": dengan satu kalimat, merancang tim agen spesialis yang sesuai domain dan secara otomatis membuat skill yang akan digunakan agen, yaitu sebuah meta-skill
  • Mendukung 6 pola arsitektur, termasuk orkestrasi antaragen dan protokol penanganan error
  • Pola arsitektur
    • Pipeline: tugas berurutan yang saling bergantung
    • Fan-out/Fan-in: tugas independen paralel
    • Pool pakar: pemanggilan selektif sesuai situasi
    • Generate-validate: membuat lalu memeriksa kualitas
    • Supervisor: agen pusat melakukan distribusi dinamis
    • Delegasi hierarkis: delegasi rekursif dari atas ke bawah
  • Workflow 6 tahap: analisis domain → desain arsitektur tim (tim agen vs sub-agen) → pembuatan definisi agen → pembuatan skill → integrasi dan orkestrasi → validasi dan pengujian
  • Ada dua mode eksekusi:
    • Tim agen (default): metode TeamCreate + SendMessage + TaskCreate, direkomendasikan saat membutuhkan 2 agen atau lebih serta kolaborasi
    • Sub-agen: pemanggilan langsung tool Agent, cocok untuk tugas sekali jalan atau saat komunikasi tidak diperlukan
  • Saat Harness dijalankan, file definisi agen (mis. analyst.md, builder.md, qa.md) dibuat otomatis di .claude/agents/, dan file skill di .claude/skills/
  • Contoh susunan tim yang bisa dibuat
    • Riset mendalamTolong susunkan harness riset. Saya butuh tim agen yang bisa meneliti topik apa pun dari berbagai sudut — pencarian web, materi akademik, reaksi komunitas — lalu melakukan verifikasi silang dan menyusun laporan gabungan.
    • Pembuatan websiteTolong susunkan harness pengembangan website full-stack. Saya butuh tim yang mengoordinasikan desain, frontend (React/Next.js), backend (API), dan pengujian QA dalam pipeline dari wireframe hingga deployment.
    • Produksi webtoonTolong susunkan harness produksi episode webtoon. Saya butuh agen untuk penulisan cerita, prompt desain karakter, perencanaan layout panel, dan penyuntingan dialog, serta mereka harus saling meninjau hasil kerja dari sisi konsistensi gaya.
    • Perencanaan konten YouTubeTolong susunkan harness produksi konten YouTube. Saya butuh tim yang dikoordinasikan agen supervisor untuk riset tren, penulisan skrip, optimasi SEO judul/tag, dan perencanaan konsep thumbnail.
    • Code reviewTolong susunkan harness code review komprehensif. Saya butuh tim agen yang mengaudit arsitektur, kerentanan keamanan, bottleneck performa, dan gaya kode secara paralel lalu menggabungkan hasilnya ke dalam satu laporan.
    • Penulisan dokumentasi teknisTolong susunkan harness untuk membuat dokumentasi API secara otomatis dari codebase ini. Saya butuh tim yang menangani analisis endpoint, penulisan deskripsi, pembuatan contoh penggunaan, dan review kualitas akhir dalam sebuah pipeline.
    • Desain pipeline dataTolong susunkan harness desain pipeline data. Saya butuh tim agen yang mendelegasikan secara hierarkis desain skema, logika ETL, aturan validasi data, dan pengaturan monitoring.
    • Kampanye pemasaranTolong susunkan harness pembuatan kampanye pemasaran. Saya butuh tim yang menjalankan riset pasar sasaran, penulisan copy iklan, desain konsep visual, dan rencana A/B test disertai review kualitas berulang.
  • revfactory/harness-100 — merilis 100 harness tim agen siap produksi untuk 10 domain (200 paket EN/KR)
    • Tiap harness mencakup 4-5 agen spesialis, skill orkestrator, dan skill khusus domain
    • Terdiri dari 1.808 file Markdown yang mencakup pembuatan konten, pengembangan software, data/AI, strategi bisnis, pendidikan, hukum, layanan kesehatan, dan lainnya
    • Semuanya dibuat dengan plugin Harness
  • Perlu mengaktifkan fitur tim agen Claude Code: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

6 komentar

 
namojo 20 hari lalu

Hasil penggunaan nyata benar-benar luar biasa. Struktur Harness buatan Minho sendiri melakukan fan-in/out, membuat berbagai multi-agent sesuai tujuan berdasarkan instruction, lalu orkestrator yang mengelolanya memecah setiap tahap pekerjaan menjadi beberapa phase untuk dijalankan.

Tingkat kualitas hasilnya mampu menghasilkan output setara semi-profesional, entah itu laporan maupun aplikasi; bahkan agent dengan beragam peran seperti coder, tester, reviewer, hingga analyst bekerja dengan sangat baik.

Mungkin Anda mengira seperti MCP atau alat lainnya, karena Harness konteksnya terus dipertahankan besar sehingga token cepat habis, tetapi jika membuka context-nya Anda bisa melihat bahwa ini digunakan seefisien mungkin. Namun, untuk menghasilkan keterbacaan atau hasil yang lebih rapi sesuai bayangan kami, perlu dibuat dan dipasang Skill pembuatan gambar nano banana berbasis Gemini API.

Bahkan dengan Claude Max 200 pun kemungkinan batas hariannya tercapai dalam 1~2 jam, dan saya menggunakan Opus.

Ini adalah hasil ketika saya memberi itinerary perjalanan Jepang dan meminta dibuatkan halaman itinerary perjalanan interaktif sebagai pemandu wisata Jepang. Untuk hal seperti ini, token yang dipakai tidak banyak dan bisa dibuat dengan cepat.

http://namojo.github.io/tokyo-tour

 
edunga1 14 hari lalu

Jika Anda sudah menggunakan tim agen Claude Code, tidak ada yang terlalu istimewa.
Namun, membangun infrastruktur dengan memanfaatkan agents atau skills agar bisa dilanjutkan bahkan di sesi baru, termasuk informasi susunan tim, terasa praktis.
Saat tim disusun secara manual, hal-hal seperti boilerplate untuk tim terus berulang.

Ada satu masalah: karena lingkungannya mempertimbangkan baik subagent maupun tim agen, dalam pola Supervisor sering muncul situasi yang tidak tepat di mana supervisor mendelegasikan pekerjaan ke subagent meskipun tim sudah terbentuk.

 
tested 21 hari lalu

Ada yang sudah coba? Mohon bagikan ulasannya.

 
xguru 22 hari lalu

Ini dibuat oleh Minho Hwang, pemimpin tim strategi AI Native di Kakao.
Saya sudah beberapa kali melihat tulisan beliau yang memperkenalkannya, jadi saya menunggu-nunggu kapan ini akan dirilis.
Saya akan coba memakainya!

 
neocode24 20 hari lalu

Saya sempat meluangkan waktu untuk merangkum apa saja yang saya terapkan. Ini saya terapkan langsung pada monorepo VibeCoding yang nyata.

Di antara Mode A (pengembangan), B (audit kode), dan C (terintegrasi: A+B), saya menjalankannya dengan Mode B pada proyek yang sudah lebih dulu berjalan.
Saya bisa menemukan hal-hal seperti ketidaksesuaian tipe antara frontend/backend yang tidak dapat ditangkap oleh analisis statis.
Saya merangkum proses penerapannya.

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 21 hari lalu

Sebagai orang yang secara pribadi sedang membuat Harness, saya penasaran hasil penerapan berbagai proyek open source itu muncul melalui pengujian seperti apa. Apakah ada alat benchmark yang terkuantifikasi dan resmi? Biasanya, saya juga penasaran bagaimana orang lain memverifikasi efektivitasnya di luar sekadar kesan subjektif.