7 poin oleh GN⁺ 2024-10-31 | Belum ada komentar. | Bagikan ke WhatsApp
  • SynthID dari Google DeepMind adalah teknologi untuk menerapkan dan mengidentifikasi watermark pada konten buatan AI dengan menyisipkan watermark digital langsung ke gambar, audio, teks, atau video yang dihasilkan AI
    • Penjelasan teknis yang lebih lengkap tentang metode ini dapat dibaca di makalah Nature
  • SynthID Text tersedia sebagai open source agar pengembang dapat menggunakan watermarking untuk pembuatan teks

Penerapan watermark

  • SynthID Text adalah pemroses logits yang diterapkan pada pipeline generasi model setelah Top-K dan Top-P
  • Dengan menggunakan pseudo-random g-function untuk memperkuat logits model, teknologi ini mengodekan informasi watermark dengan cara yang membantu menentukan apakah teks dihasilkan oleh model tanpa banyak memengaruhi kualitas teks
  • Watermark dikonfigurasi untuk memparameterisasi g-function dan mengatur cara penerapannya selama generasi
  • Setiap konfigurasi watermark yang digunakan harus disimpan secara aman dan privat
  • Dua parameter wajib yang diperlukan untuk konfigurasi watermark
    • Parameter keys: daftar bilangan bulat acak unik yang digunakan untuk menghitung skor g-function di seluruh kosakata model. Panjang daftar ini menentukan jumlah lapisan watermark yang diterapkan
    • Parameter ngram_len: digunakan untuk menyeimbangkan ketahanan dan kemampuan deteksi. Nilai yang lebih besar membuat watermark lebih mudah dideteksi tetapi lebih rentan terhadap perubahan. Nilai default 5 sudah memadai
  • Watermark dapat dikonfigurasi lebih lanjut sesuai kebutuhan performa
    • Tabel sampling terdiri dari dua properti: sampling_table_size dan sampling_table_seed
    • Untuk memastikan g-function yang tidak bias dan stabil saat sampling, sampling_table_size sebaiknya minimal 2^16 atau lebih besar
    • Namun, ukuran tabel sampling memengaruhi jumlah memori yang dibutuhkan saat inferensi
    • Untuk sampling_table_seed, dapat digunakan bilangan bulat apa pun yang diinginkan
    • N-gram yang berulang dari context_history_size token sebelumnya tidak diberi watermark untuk meningkatkan kemampuan deteksi
  • Tidak diperlukan pelatihan tambahan pada model untuk menghasilkan teks dengan watermark SynthID Text
  • Hanya diperlukan konfigurasi watermark yang dikirim ke metode .generate() milik model. Ini akan mengaktifkan pemroses logits SynthID Text
  • Anda dapat melihat contoh kode yang menunjukkan cara menerapkan watermark di library Transformers melalui posting blog dan Space dari Hugging Face

Deteksi watermark dan kemampuan verifikasi

  • Deteksi watermark bersifat probabilistik
  • Detektor Bayesian tersedia di Hugging Face Transformers dan GitHub
  • Detektor ini dapat menghasilkan tiga status deteksi yang mungkin: diberi watermark, tidak diberi watermark, atau tidak pasti
  • Dengan menetapkan dua ambang batas, perilaku dapat dikustomisasi untuk mencapai tingkat false positive dan false negative tertentu
  • Model yang menggunakan tokenizer yang sama dapat berbagi konfigurasi watermark dan detektor selama set pelatihan detektor mencakup contoh dari semua model yang berbagi watermark tersebut
  • Setelah ada detektor yang telah dilatih, Anda dapat memilih apakah dan bagaimana mengekspos detektor itu kepada pengguna dan publik
    • Opsi sepenuhnya privat tidak memublikasikan atau mengekspos detektor dalam bentuk apa pun
    • Opsi semi-privat tidak memublikasikan detektor, tetapi mengeksposnya melalui API
    • Opsi publik membuka detektor agar orang lain dapat mengunduh dan menggunakannya

Keterbatasan

  • Watermark SynthID Text kuat terhadap beberapa jenis transformasi, tetapi memiliki keterbatasan
    • Penerapan watermark kurang efektif pada respons faktual karena hanya ada sedikit peluang untuk memperkuat generasi tanpa menurunkan akurasi
    • Jika teks buatan AI ditulis ulang secara menyeluruh atau diterjemahkan ke bahasa lain, skor keyakinan detektor dapat turun secara signifikan
  • SynthID Text tidak dirancang untuk secara langsung mencegah pelaku yang berniat menyerang agar tidak menimbulkan kerugian
  • Namun, teknologi ini dapat mempersulit penggunaan konten buatan AI untuk tujuan jahat, dan bila digabungkan dengan pendekatan lain dapat memberikan cakupan yang lebih baik di berbagai jenis konten dan platform

Opini GN⁺

  • SynthID Text menyediakan fungsi yang berguna untuk mengidentifikasi asal konten buatan AI melalui watermark
  • Namun, watermark itu sendiri tidak menjamin keaslian konten. Watermark juga dapat diterapkan pada misinformasi atau konten berbahaya
  • Karena itu, selain watermark, verifikasi keandalan terhadap isi konten itu sendiri juga akan diperlukan
  • Fakta bahwa teknologi ini terintegrasi ke library utama seperti Hugging Face sehingga mudah dimanfaatkan pengembang adalah keunggulan besar
  • Namun, apakah detektor akan dipublikasikan perlu diputuskan dengan hati-hati. Jika dibuka sepenuhnya, upaya untuk melewati watermark bisa meningkat
  • Secara keseluruhan, di tengah cepatnya penyebaran konten buatan AI, pentingnya SynthID Text sebagai teknologi untuk mengidentifikasi asal konten tampaknya akan semakin besar

Belum ada komentar.

Belum ada komentar.