Usulan untuk Penerapan Nilai Sosial: Membangun Kehendak yang Dapat Bernalar Secara Konsisten dengan Model Bahasa [Terjemahan]

xguru · 2023-03-13T10:56:01+09:00

Tulisan yang diunggah di blog oleh Jan Leike, pemimpin tim alignment OpenAI, diterjemahkan dengan DeepL Alignment adalah "menyelaraskan satu sistem AI dengan satu manusia" Ada dua kategori penyelarasan: sesuai dengan "preferensi individu (semua orang menginginkan AI yang selaras dengan dirinya)" dan "preferensi kolektif (untuk tujuan apa AI dapat digunakan, dan seperti apa perilaku dasarnya seharusnya)" Tulisan ini membahas kategori kedua Usulan: demokrasi deliberatif yang disimulasikan Gagasan intinya adalah menggunakan model bahasa besar untuk dilatih meniru "demokrasi deliberatif" Demokrasi deliberatif adalah proses pengambilan keputusan atau penetapan kebijakan di mana sebagian kecil warga yang dipilih secara acak ('mini-public') melakukan deliberasi secara eksplisit Cara membangun demokrasi deliberatif yang disimulasikan Mengumpulkan dataset pertanyaan tentang nilai Catatan deliberasi manusia Pembelajaran imitasi dengan kondisi latar belakang Simulasi: pertanyaan tentang nilai-nilai baru

(docs.google.com)

7 poin oleh xguru 2023-03-13 | 1 komentar | Bagikan ke WhatsApp

Tulisan yang diunggah di blog oleh Jan Leike, pemimpin tim alignment OpenAI, diterjemahkan dengan DeepL
Alignment adalah "menyelaraskan satu sistem AI dengan satu manusia"
Ada dua kategori penyelarasan: sesuai dengan "preferensi individu (semua orang menginginkan AI yang selaras dengan dirinya)" dan "preferensi kolektif (untuk tujuan apa AI dapat digunakan, dan seperti apa perilaku dasarnya seharusnya)"
Tulisan ini membahas kategori kedua

Usulan: demokrasi deliberatif yang disimulasikan

Gagasan intinya adalah menggunakan model bahasa besar untuk dilatih meniru "demokrasi deliberatif"
- Demokrasi deliberatif adalah proses pengambilan keputusan atau penetapan kebijakan di mana sebagian kecil warga yang dipilih secara acak ('mini-public') melakukan deliberasi secara eksplisit
Cara membangun demokrasi deliberatif yang disimulasikan
- Mengumpulkan dataset pertanyaan tentang nilai
- Catatan deliberasi manusia
- Pembelajaran imitasi dengan kondisi latar belakang
- Simulasi: pertanyaan tentang nilai-nilai baru

1 komentar

xguru 2023-03-13

Silakan baca juga "Penjelasan tambahan tentang konteks tulisan ini" dari Choi Seung-jun. (Tautannya juga ada di bagian awal dokumen)
https://facebook.com/seungjoon.choi/posts/…

Usulan untuk Penerapan Nilai Sosial: Membangun Kehendak yang Dapat Bernalar Secara Konsisten dengan Model Bahasa [Terjemahan]

Usulan: demokrasi deliberatif yang disimulasikan

Bacaan terkait

1 komentar