Meretas Model Kecerdasan Buatan Bahasa Alami
(arxiv.org)-
Menurut makalah yang diumumkan bersama oleh Google, Harvard, Stanford, OpenAI, dan Apple, hanya dengan mengajukan pertanyaan kepada model bahasa besar, data spesifik yang digunakan dalam pelatihan dapat diekstraksi.
-
Serangan terhadap GPT-2 berhasil mengekstraksi data pribadi seperti judul berita dan alamat rumah dengan tingkat akurasi yang sangat tinggi.
-
Bukan hanya GPT-2, model bahasa lain juga bisa rentan terhadap serangan semacam ini, sehingga perlu lebih berhati-hati dalam prapemrosesan data pelatihan.
Belum ada komentar.