2 poin oleh fastkoder 6 jam lalu | 1 komentar | Bagikan ke WhatsApp

TL;DR

Untuk harness yang berfokus pada review — code review, review dokumen, riset UX, simulasi wawancara — nilainya muncul ketika 5 reviewer membawa 5 sudut pandang yang berbeda. Pada tim agen AI biasa, kelima orang itu cenderung punya nada dan perspektif yang mirip, sehingga pada praktiknya 1 opini hanya diulang 5 kali.

Fork ini menarik NVIDIA Nemotron-Personas-Korea (1 juta baris, CC BY 4.0) melalui pencarian dinamis saat runtime, lalu menempelkan sosok nyata dari dunia kerja Korea (hingga peran kerja, generasi, wilayah, dan kondisi keluarga) ke agen sehingga menghasilkan review dengan sudut pandang yang benar-benar berbeda.

Mengapa kedalaman persona dibutuhkan untuk harness review

Bahkan ketika melihat kode/dokumen/desain yang sama, tiap orang punya sudut pandang berbeda:

  • Lead backend 45 tahun berlatar SI
    → "Dari sisi manajemen risiko, mari kita pakai deployment bertahap. Kalau validasinya cukup, pada akhirnya jadwal justru bisa lebih singkat."

  • Growth marketer MZ 24 tahun
    → "Bagus karena cepat membuat hipotesis penyebab saat angkanya melonjak, tapi tingkat signifikansinya agak lemah. Mau kita lanjutkan A/B test lagi?"

  • PM ibu bekerja 38 tahun
    → "Kalau kesimpulannya tetap tidak bisa masuk kuartal ini, tolong kita atur ulang prioritasnya dulu."

  • Designer 27 tahun berlatar fintech
    → "Di data kualitatif dari wawancara pengguna, komentar seperti 'momen saat menerima kupon terasa agak datar' terus berulang."

→ Bahkan untuk kode yang sama, 4 orang akan menangkap risiko/nilai/prioritas yang berbeda. Itulah esensi tim review.

Apa yang ditambahkan (3 skill baru, non-invasif)

revfactory/harness yang ada tidak diubah; percabangan trigger otomatis dilakukan lewat kata kunci description:

  • korean-persona-search — filter multi-sumbu dengan Parquet predicate pushdown (pekerjaan, wilayah, usia, pendidikan, generasi) + sampling keragaman
  • korean-voice-adapter — matriks gaya formal/sopan + budaya kerja kantor Korea (jalur pelaporan, etika rapat, ekspresi tidak langsung) + kamus kosakata untuk 13 industri
  • korean-persona-harness — meta orchestrator (pipeline 5 sub-agen: analis skenario → kurator persona → adaptor gaya bicara → pembuat agen → QA keragaman)

Kompatibel dengan Claude Code dan Codex CLI — format SKILL.md sama, cache dataset dibagi bersama.

Verifikasi — LLM yang sama, tugas yang sama, volume yang sama (102 baris vs 103 baris)

Simulasi notulen weekly standup meeting tim 5 orang. Akurasi domain setara. Perbedaannya terlihat pada keragaman perspektif.

Hasil harness biasa:

  • Keterbedaan suara: rendah (5 orang hampir bernada sama)
  • Etika kerja kantor Korea: minim
  • Respons timbal balik, dorongan, ucapan terima kasih: 0 kali
  • Nada meminta/konfirmasi: 5 kali
  • Pengungkapan urusan pribadi: 0 kasus

Hasil korean-persona-harness:

  • Keterbedaan suara: sangat tinggi (bahkan tanpa nama tetap bisa dibedakan)
  • Etika kerja kantor Korea: kaya (menghindari pernyataan mutlak, mentoring, nada konfirmasi)
  • Respons timbal balik, dorongan, ucapan terima kasih: 4 kali
  • Nada meminta/konfirmasi: 11 kali
  • Pengungkapan urusan pribadi: 2 kasus (jadwal keluarga, permohonan terkait otoritas)

Detail yang terasa manusiawi dan hanya muncul di Run B:

Backend (ayah dua anak): "Minggu depan saya ada jadwal anak, jadi bagaimana kalau kita rapikan rotasinya lebih dulu dari sekarang."

  • Etika kerja kantor Korea: minim
  • Etika kerja kantor Korea: minim
  • Respons timbal balik, dorongan, ucapan terima kasih: 0 kali
  • Nada meminta/konfirmasi: 5 kali
  • Pengungkapan urusan pribadi: 0 kasus

Hasil korean-persona-harness:

  • Keterbedaan suara: sangat tinggi (bahkan tanpa nama tetap bisa dibedakan)
  • Etika kerja kantor Korea: kaya (menghindari pernyataan mutlak, mentoring, nada konfirmasi)
  • Respons timbal balik, dorongan, ucapan terima kasih: 4 kali
  • Nada meminta/konfirmasi: 11 kali
  • Pengungkapan urusan pribadi: 2 kasus (jadwal keluarga, permohonan terkait otoritas)

Detail yang terasa manusiawi dan hanya muncul di Run B:

Backend (ayah dua anak): "Minggu depan saya ada jadwal anak, jadi bagaimana kalau kita rapikan rotasinya lebih dulu dari sekarang."

Team lead (45) → marketer (24): "Sikapmu yang cepat membangun hipotesis penyebab saat angka melonjak, lanjutkan saja seperti itu."
Marketer: "Ah, terima kasih Pak/Bu lead!"

Team lead: "Namun kebijakan retry di pihak kita bekerja terlalu agresif, jadi ada indikasi gangguan sempat makin membesar. Saya akan menahan kesimpulan final sampai RCA versi akhir keluar."

→ Persona keluarga, generasi, dan profesi menyatu secara alami ke dalam tuturan. Bukan sekadar 'stabilitas lebih dulu' yang abstrak, tetapi mengapa orang ini punya prioritas seperti itu tampak langsung dalam perilakunya.

Matriks nilai — cocok dipakai di mana

  • Code review (5 orang, 5 sudut pandang berbeda) → sangat tinggi
  • Simulasi wawancara pengguna virtual → sangat tinggi
  • Review copy marketing untuk pengguna Korea → sangat tinggi
  • Riset UX dan workshop persona → tinggi
  • Simulasi notulen rapat dan kolaborasi → tinggi
  • RFC dan dokumen teknis → sedang
  • Desain infrastruktur dan arsitektur → rendah (harness dasar lebih cocok)

Instalasi (1 baris)

Claude Code:

  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness  

Codex CLI:

  python3 ~/.codex/skills/.system/skill-installer/scripts/install-skill-from-github.py \  
      --repo hongsw/harness \  
      --path skills/korean-persona-search \  
      --path skills/korean-voice-adapter \  
      --path skills/korean-persona-harness  

Cache dataset (dibagi oleh kedua runtime):

  pip install huggingface_hub pyarrow  
  python3 $SKILL_DIR/korean-persona-search/scripts/download.py  

⚠️ Perhatian: installer revfactory/harness yang lama memakai nama marketplace dan plugin yang sama, jadi perlu migrasi 4 langkah:

  /plugin uninstall harness@harness  
  /plugin marketplace remove harness-marketplace  
  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness  

Tautan

1 komentar

 
tomlee 4 jam lalu

Menarik juga, hehe. Kami juga sedang bergerak di area yang mirip tetapi dengan jalur yang berbeda — yaitu ClawSouls (clawsouls.ai), sebuah registry penyimpanan dan platform berbagi persona. Persona yang sudah sekali didaftarkan bisa diterapkan ke platform agen seperti OpenClaw, Claude Code, Cursor, dan Hermes Agent melalui paket npm clawsouls. Kami akan berterima kasih jika Anda bisa mengunggahnya sekali. Platform tersebut juga pernah diperkenalkan di GeekNews. Show GN: ClawSouls – registry terbuka untuk mengganti persona AI agent dalam satu baris Jika Anda tertarik untuk berkolaborasi, mohon hubungi kami^^ ( contact@clawsouls.ai )