7 poin oleh xguru 2023-03-13 | 1 komentar | Bagikan ke WhatsApp
  • Tulisan yang diunggah di blog oleh Jan Leike, pemimpin tim alignment OpenAI, diterjemahkan dengan DeepL
  • Alignment adalah "menyelaraskan satu sistem AI dengan satu manusia"
  • Ada dua kategori penyelarasan: sesuai dengan "preferensi individu (semua orang menginginkan AI yang selaras dengan dirinya)" dan "preferensi kolektif (untuk tujuan apa AI dapat digunakan, dan seperti apa perilaku dasarnya seharusnya)"
  • Tulisan ini membahas kategori kedua

Usulan: demokrasi deliberatif yang disimulasikan

  • Gagasan intinya adalah menggunakan model bahasa besar untuk dilatih meniru "demokrasi deliberatif"
    • Demokrasi deliberatif adalah proses pengambilan keputusan atau penetapan kebijakan di mana sebagian kecil warga yang dipilih secara acak ('mini-public') melakukan deliberasi secara eksplisit
  • Cara membangun demokrasi deliberatif yang disimulasikan
    • Mengumpulkan dataset pertanyaan tentang nilai
    • Catatan deliberasi manusia
    • Pembelajaran imitasi dengan kondisi latar belakang
    • Simulasi: pertanyaan tentang nilai-nilai baru

1 komentar

 
xguru 2023-03-13

Silakan baca juga "Penjelasan tambahan tentang konteks tulisan ini" dari Choi Seung-jun. (Tautannya juga ada di bagian awal dokumen)
https://facebook.com/seungjoon.choi/posts/…