Google DeepMind merilis open source SynthID untuk memberi watermark dan mendeteksi teks yang dihasilkan LLM

(github.com/google-deepmind)

7 poin oleh GN⁺ 2024-10-31 | Belum ada komentar. | Bagikan ke WhatsApp

SynthID dari Google DeepMind adalah teknologi untuk menerapkan dan mengidentifikasi watermark pada konten buatan AI dengan menyisipkan watermark digital langsung ke gambar, audio, teks, atau video yang dihasilkan AI
- Penjelasan teknis yang lebih lengkap tentang metode ini dapat dibaca di makalah Nature
SynthID Text tersedia sebagai open source agar pengembang dapat menggunakan watermarking untuk pembuatan teks

Penerapan watermark

SynthID Text adalah pemroses logits yang diterapkan pada pipeline generasi model setelah Top-K dan Top-P
Dengan menggunakan pseudo-random g-function untuk memperkuat logits model, teknologi ini mengodekan informasi watermark dengan cara yang membantu menentukan apakah teks dihasilkan oleh model tanpa banyak memengaruhi kualitas teks
Watermark dikonfigurasi untuk memparameterisasi g-function dan mengatur cara penerapannya selama generasi
Setiap konfigurasi watermark yang digunakan harus disimpan secara aman dan privat
Dua parameter wajib yang diperlukan untuk konfigurasi watermark
- Parameter keys: daftar bilangan bulat acak unik yang digunakan untuk menghitung skor g-function di seluruh kosakata model. Panjang daftar ini menentukan jumlah lapisan watermark yang diterapkan
- Parameter ngram_len: digunakan untuk menyeimbangkan ketahanan dan kemampuan deteksi. Nilai yang lebih besar membuat watermark lebih mudah dideteksi tetapi lebih rentan terhadap perubahan. Nilai default 5 sudah memadai
Watermark dapat dikonfigurasi lebih lanjut sesuai kebutuhan performa
- Tabel sampling terdiri dari dua properti: sampling_table_size dan sampling_table_seed
- Untuk memastikan g-function yang tidak bias dan stabil saat sampling, sampling_table_size sebaiknya minimal 2^16 atau lebih besar
- Namun, ukuran tabel sampling memengaruhi jumlah memori yang dibutuhkan saat inferensi
- Untuk sampling_table_seed, dapat digunakan bilangan bulat apa pun yang diinginkan
- N-gram yang berulang dari context_history_size token sebelumnya tidak diberi watermark untuk meningkatkan kemampuan deteksi
Tidak diperlukan pelatihan tambahan pada model untuk menghasilkan teks dengan watermark SynthID Text
Hanya diperlukan konfigurasi watermark yang dikirim ke metode .generate() milik model. Ini akan mengaktifkan pemroses logits SynthID Text
Anda dapat melihat contoh kode yang menunjukkan cara menerapkan watermark di library Transformers melalui posting blog dan Space dari Hugging Face

Deteksi watermark dan kemampuan verifikasi

Deteksi watermark bersifat probabilistik
Detektor Bayesian tersedia di Hugging Face Transformers dan GitHub
Detektor ini dapat menghasilkan tiga status deteksi yang mungkin: diberi watermark, tidak diberi watermark, atau tidak pasti
Dengan menetapkan dua ambang batas, perilaku dapat dikustomisasi untuk mencapai tingkat false positive dan false negative tertentu
Model yang menggunakan tokenizer yang sama dapat berbagi konfigurasi watermark dan detektor selama set pelatihan detektor mencakup contoh dari semua model yang berbagi watermark tersebut
Setelah ada detektor yang telah dilatih, Anda dapat memilih apakah dan bagaimana mengekspos detektor itu kepada pengguna dan publik
- Opsi sepenuhnya privat tidak memublikasikan atau mengekspos detektor dalam bentuk apa pun
- Opsi semi-privat tidak memublikasikan detektor, tetapi mengeksposnya melalui API
- Opsi publik membuka detektor agar orang lain dapat mengunduh dan menggunakannya

Keterbatasan

Watermark SynthID Text kuat terhadap beberapa jenis transformasi, tetapi memiliki keterbatasan
- Penerapan watermark kurang efektif pada respons faktual karena hanya ada sedikit peluang untuk memperkuat generasi tanpa menurunkan akurasi
- Jika teks buatan AI ditulis ulang secara menyeluruh atau diterjemahkan ke bahasa lain, skor keyakinan detektor dapat turun secara signifikan
SynthID Text tidak dirancang untuk secara langsung mencegah pelaku yang berniat menyerang agar tidak menimbulkan kerugian
Namun, teknologi ini dapat mempersulit penggunaan konten buatan AI untuk tujuan jahat, dan bila digabungkan dengan pendekatan lain dapat memberikan cakupan yang lebih baik di berbagai jenis konten dan platform

Opini GN⁺

SynthID Text menyediakan fungsi yang berguna untuk mengidentifikasi asal konten buatan AI melalui watermark
Namun, watermark itu sendiri tidak menjamin keaslian konten. Watermark juga dapat diterapkan pada misinformasi atau konten berbahaya
Karena itu, selain watermark, verifikasi keandalan terhadap isi konten itu sendiri juga akan diperlukan
Fakta bahwa teknologi ini terintegrasi ke library utama seperti Hugging Face sehingga mudah dimanfaatkan pengembang adalah keunggulan besar
Namun, apakah detektor akan dipublikasikan perlu diputuskan dengan hati-hati. Jika dibuka sepenuhnya, upaya untuk melewati watermark bisa meningkat
Secara keseluruhan, di tengah cepatnya penyebaran konten buatan AI, pentingnya SynthID Text sebagai teknologi untuk mengidentifikasi asal konten tampaknya akan semakin besar

Google DeepMind merilis open source SynthID untuk memberi watermark dan mendeteksi teks yang dihasilkan LLM

Penerapan watermark

Deteksi watermark dan kemampuan verifikasi

Keterbatasan

Opini GN⁺

Bacaan terkait

Belum ada komentar.