- Tulisan yang diunggah di blog oleh Jan Leike, pemimpin tim alignment OpenAI, diterjemahkan dengan DeepL
- Alignment adalah "menyelaraskan satu sistem AI dengan satu manusia"
- Ada dua kategori penyelarasan: sesuai dengan "preferensi individu (semua orang menginginkan AI yang selaras dengan dirinya)" dan "preferensi kolektif (untuk tujuan apa AI dapat digunakan, dan seperti apa perilaku dasarnya seharusnya)"
- Tulisan ini membahas kategori kedua
Usulan: demokrasi deliberatif yang disimulasikan
- Gagasan intinya adalah menggunakan model bahasa besar untuk dilatih meniru "demokrasi deliberatif"
- Demokrasi deliberatif adalah proses pengambilan keputusan atau penetapan kebijakan di mana sebagian kecil warga yang dipilih secara acak ('mini-public') melakukan deliberasi secara eksplisit
- Cara membangun demokrasi deliberatif yang disimulasikan
- Mengumpulkan dataset pertanyaan tentang nilai
- Catatan deliberasi manusia
- Pembelajaran imitasi dengan kondisi latar belakang
- Simulasi: pertanyaan tentang nilai-nilai baru
1 komentar
Silakan baca juga "Penjelasan tambahan tentang konteks tulisan ini" dari Choi Seung-jun. (Tautannya juga ada di bagian awal dokumen)
https://facebook.com/seungjoon.choi/posts/…