7 poin oleh kimchi 27 hari lalu | 4 komentar | Bagikan ke WhatsApp

Menjalankan simulasi pemilihan gubernur/provinsi 2026 dengan menempelkan LLM ke Nemotron-Personas-Korea.

Merayapi 8.300 kandidat dari NEC → sampling 5.100 persona, masing-masing 300 orang per provinsi/kota → simulasi 4.800 suara dengan Gemma 4 e4b (RTX 5060, 3 jam).

Hasil

Wali Kota Daegu: Kim Han-gu (independen) 90,5% / Lee Jae-man (PPP) 8,2% / Kim Boo-kyum (Demokrat) 1,4%

Mantan Perdana Menteri + 4 kali anggota parlemen + berasal dari Daegu hanya mendapat 1,4%. LLM tertarik pada label "pekerja" dalam persona lalu memusatkan suara ke kandidat pekerja independen.

Pola keseluruhan:

  • Premi petahana dibesar-besarkan (Kim Jin-tae di Gangwon 100%, Lee Cheol-woo di Gyeongbuk 99%)
  • Pencocokan sederhana berdasarkan label pekerjaan
  • Lonjakan golput saat informasi minim (Chungbuk 73%, Incheon 93%)

Kesimpulan

Simulasi persona LLM tidak bisa menjadi pengganti survei opini publik. Ini menegaskan secara kuantitatif bahwa riset LLM-as-voter di Amerika tidak bisa langsung diterapkan begitu saja pada politik Korea.

4 komentar

 
calmlake79 26 hari lalu

Saya adalah pembuat "ManyPerson" yang ada di "Artikel yang bagus untuk dibaca bersama".
Seperti yang Anda katakan, simulasi persona LLM bukanlah pengganti survei opini publik, melainkan "pelengkap".
Tentu saja, semakin tinggi presisi persona dan semakin banyak informasi latar belakang yang dimasukkan, hasilnya mungkin akan semakin mendekati nilai sebenarnya, tetapi pada dasarnya saya juga membangun layanan ini dengan memandangnya sebagai layanan pelengkap, bukan sebagai layanan pengganti.
Meski begitu, saya rasa nilainya tetap sangat besar.

 
kimchi 26 hari lalu

Saya setuju!!

 
calmlake79 26 hari lalu

Sekarang saya lihat tadi saya agak linglung jadi sempat berhenti di tengah saat menulis jawaban;;

Pertama, salah satu nilai dari respons persona AI menurut saya adalah..
yang paling besar ialah memberikan sudut pandang yang lebih luas kepada pengguna atau penulis.

Saya juga merasakan ini saat membuat layanan ini: cara pandang saya terhadap dunia atau berbagai peristiwa memang jadi lebih luas.
Dari "Kenapa dia memikirkan itu seperti itu?" menjadi "Ah, ternyata ada juga yang bisa menerima dan memahami kejadian seperti itu dengan cara seperti itu.."
Jadi rasanya kita bisa melihat sesuatu dengan lebih luas.
Saya rasa untuk kasus pemilu yang Anda sebutkan juga akan sama.

Barusan saya coba menjalankannya untuk Daegu yang sama, dan hasilnya memang terlihat agak jauh dari kenyataan.

manyperson Link

Kami juga sempat menguji hal serupa di layanan kami, dan hasilnya memang tidak persis keluar seperti yang saya bayangkan, tetapi tetap memungkinkan untuk melihat berbagai sudut pandang. (Tentu, karena pembaruan informasi terbaru, akurasinya memang belum terlalu tinggi, tetapi menurut saya ini hal yang bisa ditangani secara teknis sedikit demi sedikit.)

Sebenarnya, layanan kami sendiri juga kami uji sambil bertanya-tanya orang-orang akan berpikir bagaimana.. dan hasilnya sangat positif, tetapi kenyataannya saya sendiri juga masih belum yakin ^^;;

 
kimchi 26 hari lalu

Karena LLM melakukan inferensi pada tingkat token teks, tampaknya ketika label berfrekuensi tinggi muncul, pola yang saat pelatihan muncul bersama label tersebut menjadi aktif dan cenderung mendominasi informasi lain.

Selain itu, meskipun sebuah persona memiliki label yang detail, perilaku memilih orang tersebut tidak ditentukan sebagai fungsi yang bisa diinferensikan oleh LLM; yang benar-benar menentukan perilaku politik nyata dipengaruhi oleh terlalu banyak informasi yang tidak ada dalam persona sintetis, seperti riwayat pemungutan suara sebelumnya, partai yang didukung keluarga dan rekan kerja, berita yang baru-baru ini dilihat, serta tingkat kesukaan pribadi terhadap kandidat.
Ini tampaknya bekerja secara bersamaan bukan hanya pada hal ini saja, tetapi juga saat menginferensikan semua situasi/fenomena ekonomi/politik (tertentu).