Membangun Tim Agen AI yang Mengulas seperti Orang Korea Asli (Fork Harness + 1 Juta Persona NVIDIA)

TL;DR

Untuk harness yang berfokus pada aktivitas review — code review, review dokumen, riset UX, simulasi wawancara — nilainya baru terasa jika 5 reviewer membawa 5 sudut pandang yang berbeda. Pada tim agen AI biasa, kelimanya cenderung punya
nada dan sudut pandang yang mirip, sehingga pada praktiknya satu opini yang sama hanya diulang 5 kali.

Fork ini memanfaatkan NVIDIA Nemotron-Personas-Korea (1 juta baris, CC BY 4.0) melalui pencarian dinamis saat runtime, lalu membekali agen dengan persona nyata dari dunia kerja Korea (hingga peran, generasi, wilayah, dan kondisi keluarga) agar bisa menghasilkan review dengan sudut pandang yang benar-benar berbeda.

Mengapa kedalaman persona diperlukan untuk harness review

Orang yang melihat kode/dokumen/desain yang sama tetap akan punya sudut pandang berbeda:

Lead backend usia 45 tahun dengan latar SI
→ "Dari sisi manajemen risiko, mari pakai deployment bertahap. Kalau verifikasinya cukup, pada akhirnya justru jadwal bisa lebih singkat."
Growth marketer Gen MZ usia 24 tahun
→ "Cara Anda cepat membangun hipotesis penyebab saat angka melonjak itu bagus, tapi tingkat signifikansinya agak lemah. Mau kita lanjutkan A/B test lagi?"
PM working mom usia 38 tahun
→ "Kalau pada akhirnya ini tidak bisa masuk di kuartal ini, tolong kita atur ulang prioritasnya dulu ya."
Desainer usia 27 tahun dengan latar fintech
→ "Di data kualitatif dari wawancara pengguna, komentar seperti 'momen saat menerima kupon terasa agak datar' muncul berulang kali."

→ Bahkan saat melihat kode yang sama, empat orang bisa menangkap risiko/nilai/prioritas yang berbeda. Itulah esensi tim review.

Apa yang ditambahkan (3 skill baru, non-invasif)

revfactory/harness yang ada tetap tanpa perubahan, dengan percabangan trigger otomatis berdasarkan kata kunci description:

korean-persona-search — filter multi-dimensi dengan Parquet predicate pushdown (jabatan, wilayah, usia, pendidikan, generasi) + sampling untuk keberagaman
korean-voice-adapter — matriks gaya bahasa formal/sopan + budaya kerja kantor Korea (jalur pelaporan, etika rapat, ungkapan tidak langsung) + kamus kosakata untuk 13 industri
korean-persona-harness — meta orchestrator (pipeline 5 sub-agen: analis skenario → kurator persona → adaptor gaya bicara → pembuat agen → QA keberagaman)

Kompatibel dengan Claude Code dan Codex CLI — format SKILL.md sama, cache dataset dipakai bersama.

Verifikasi — LLM yang sama, tugas yang sama, panjang yang sama (102 baris vs 103 baris)

Simulasi notulen rapat stand-up mingguan untuk tim beranggotakan 5 orang. Akurasi domain setara. Perbedaannya muncul pada keberagaman sudut pandang.

Hasil harness biasa:

Keterbedaan suara: rendah (5 orang hampir bernada sama)
Etiket kerja kantor Korea: minim
Respons timbal balik, dukungan, dan ucapan terima kasih: 0 kali
Nada permintaan/konfirmasi: 5 kali
Pengungkapan situasi pribadi: 0 kasus

Hasil korean-persona-harness:

Keterbedaan suara: sangat tinggi (bahkan tanpa nama pun bisa dibedakan)
Etiket kerja kantor Korea: kaya (menghindari pernyataan pasti, mentoring, nada konfirmasi)
Respons timbal balik, dukungan, dan ucapan terima kasih: 4 kali
Nada permintaan/konfirmasi: 11 kali
Pengungkapan situasi pribadi: 2 kasus (jadwal keluarga, alasan terkait kewenangan)

Detail manusiawi yang hanya muncul di Run B:

Backend (ayah dua anak): "Minggu depan saya ada sedikit jadwal anak, jadi mungkin akan lebih baik kalau rotasinya kita rapikan lebih dulu dari sekarang."

Etiket kerja kantor Korea: minim
Etiket kerja kantor Korea: minim
Respons timbal balik, dukungan, dan ucapan terima kasih: 0 kali
Nada permintaan/konfirmasi: 5 kali
Pengungkapan situasi pribadi: 0 kasus

Hasil korean-persona-harness:

Keterbedaan suara: sangat tinggi (bahkan tanpa nama pun bisa dibedakan)
Etiket kerja kantor Korea: kaya (menghindari pernyataan pasti, mentoring, nada konfirmasi)
Respons timbal balik, dukungan, dan ucapan terima kasih: 4 kali
Nada permintaan/konfirmasi: 11 kali
Pengungkapan situasi pribadi: 2 kasus (jadwal keluarga, alasan terkait kewenangan)

Detail manusiawi yang hanya muncul di Run B:

Backend (ayah dua anak): "Minggu depan saya ada sedikit jadwal anak, jadi mungkin akan lebih baik kalau rotasinya kita rapikan lebih dulu dari sekarang."

Lead tim (45) → marketer (24): "Sikap Anda yang cepat membangun hipotesis penyebab saat angka melonjak, lanjutkan seperti itu."
Marketer: "Ah, terima kasih Pak!"

Lead tim: "Namun, ada indikasi bahwa kebijakan retry di pihak kami berjalan terlalu agresif sehingga sebagian gangguan justru membesar. Saya akan menahan kesimpulan final sampai versi akhir RCA."

→ Persona keluarga, generasi, dan jabatan menyatu secara alami dalam tuturan. Bukan sekadar "stabilitas lebih dulu" yang abstrak, tetapi mengapa orang ini punya prioritas itu benar-benar terlihat dalam perilakunya.

Matriks nilai — cocok dipakai di mana

Code review (5 orang, 5 sudut pandang berbeda) → sangat tinggi
Simulasi wawancara pengguna virtual → sangat tinggi
Review copy pemasaran untuk pengguna Korea → sangat tinggi
Riset UX dan workshop persona → tinggi
Simulasi notulen rapat dan kolaborasi → tinggi
RFC dan dokumen teknis → sedang
Desain infrastruktur dan arsitektur → rendah (harness dasar lebih cocok)

Instalasi (1 baris)

Claude Code:

  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness

Codex CLI:

  python3 ~/.codex/skills/.system/skill-installer/scripts/install-skill-from-github.py \  
      --repo hongsw/harness \  
      --path skills/korean-persona-search \  
      --path skills/korean-voice-adapter \  
      --path skills/korean-persona-harness

Cache dataset (dibagikan di kedua runtime):

  pip install huggingface_hub pyarrow  
  python3 $SKILL_DIR/korean-persona-search/scripts/download.py

⚠️ Perhatian: installer revfactory/harness yang ada membutuhkan migrasi 4 langkah karena nama marketplace dan pluginnya sama:

  /plugin uninstall harness@harness  
  /plugin marketplace remove harness-marketplace  
  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness

Tautan

Repo fork: github.com/hongsw/harness
PR upstream #9 (menunggu merge): github.com/revfactory/harness/pull/9
Hasil verifikasi: _workspace/comparison_test
Dataset: huggingface.co/.../Nemotron-Personas-Korea (CC BY 4.0)
Harness asli: github.com/revfactory/harness