Bagaimana cara menghambat pelatihan LLM pada gambar karya akhir-akhir ini?

(lobste.rs)

1 poin oleh GN⁺ 1 hari lalu | 1 komentar | Bagikan ke WhatsApp

Seorang pengguna menjelaskan bahwa istrinya ragu memublikasikan gambar karya secara online karena tidak ingin itu digunakan untuk pelatihan LLM
Inti pertanyaannya adalah apakah saat ini ada pustaka atau metode yang praktis untuk melakukan pra-pemrosesan gambar guna mengganggu pelatihan LLM
Pengguna ingin tahu apakah ada alat yang cukup mumpuni sehingga ia bisa membuat situs web kustom untuk istrinya sendiri
Ia sendiri tidak punya banyak pengalaman frontend, tetapi bisa membuat situs sederhana dengan generator situs statis
Ia pernah menggunakan Eleventy untuk membuat situs web band di masa lalu, jadi sedang mempertimbangkan membangun situs statis dengan cara serupa

Konteks pertanyaan

Istrinya tidak ingin mengunggah gambar karyanya ke internet
- Alasannya karena ia tidak ingin gambar tersebut digunakan untuk pelatihan LLM
Pengguna sedang mencari apakah ada cara untuk memproses gambar karya terlebih dahulu agar pelatihan LLM menjadi lebih sulit

Solusi yang diinginkan

Ia sedang mempertimbangkan membuat situs web kustom sendiri untuk istrinya
Syarat yang dibutuhkan adalah apakah benar-benar ada pustaka atau metode untuk memproses gambar karya sehingga bisa mengganggu pelatihan LLM
Kondisi teknis dirinya adalah sebagai berikut
- Tidak punya banyak pengalaman frontend
- Bisa membuat situs sederhana dengan generator situs statis
- Sebelumnya pernah membuat situs web band dengan Eleventy

1 komentar

GN⁺ 1 hari lalu

Pendapat di Lobste.rs

Pembaruan: sepertinya bagus untuk melihat cara
Teman artis saya mengunggah karyanya di sana dan tampaknya puas
Mereka mengusung artist-first, secara terbuka cenderung anti-AI, dan tampaknya juga punya integrasi Glaze untuk mencegah gambar dipakai dalam pelatihan AI
Dan yang ingin saya katakan mungkin bukan LLM melainkan model difusi. Karena LLM menangani teks, itu mungkin membantu saat mencari informasi
Saya ingat Nightshade, tetapi setelah cek cepat, tampaknya itu muncul sekitar 2023/24 dan saya tidak menemukan tanda-tanda repositori atau pemeliharaan
Masalah dengan pendekatan meracuni atau menyembunyikan karya seni yang bisa diakses LLM adalah kita tidak tahu seberapa efektifnya, dan mungkin memang tidak akan pernah tahu. Pada akhirnya semuanya masuk ke dalam kotak hitam
Jika Anda tidak ingin karya Anda dikumpulkan oleh LLM, ada beberapa pilihan, masing-masing dengan kelebihan dan kekurangannya
1. Jangan unggah secara online. Sangat sederhana, tetapi ini hanya berhasil jika tidak ada orang lain yang ikut mengunggahnya. Jika berupa buku, perusahaan AI juga bisa mendapatkannya lewat jalur lain seperti pemindaian
2. Publikasikan online hanya di balik pendaftaran dan login. Orang yang berminat tetap bisa mengakses, dan LLM umum tidak bisa. Tentu ini mengandaikan tidak ada orang yang mengunggah ulang tanpa penghalang login
3. Letakkan di balik pertahanan anti-crawler yang kuat. Agak canggung menyebut alat buatan saya sendiri, tetapi menaruh sesuatu seperti iocaine di depan situs bisa memblokir banyak crawler. Tidak semuanya, tetapi cukup untuk sangat menurunkan kemungkinan masuk ke pelatihan, dan hambatannya juga tidak terlalu besar bagi pengunjung normal
  Hal penting lain adalah, jika Anda ingin tidak masuk data pelatihan, Anda mungkin juga perlu tidak muncul di mesin pencari. Mesin pencari komersial melatih model dari materi yang mereka indeks, jadi jika sesuatu bisa ditemukan di Google Search, besar kemungkinan materi yang sama juga masuk ke Gemini
  Pada akhirnya, jika Anda ingin membuat situs portofolio tanpa pelatihan LLM, itu sulit. Jika sekadar ingin mengunggah karya secara online, penghalang login atau pertahanan anti-crawler yang kuat bisa sangat mengurangi kemungkinan dipakai untuk pelatihan. Sayangnya itu tidak bisa menjadi 0, dan tidak ada alat ajaib yang pasti bisa menyembunyikan atau meracuni karya Anda
Sepertinya intuisi istri Anda benar. Setidaknya secara publik, jawaban yang paling mendekati adalah jangan unggah ke internet
- Tidak enak memang, tetapi tampaknya begitulah situasinya untuk hampir semua bentuk ekspresi kreatif manusia
  Jika Anda tidak ingin menjadi bahan bakar bagi mesin hasil generatif berkualitas rendah, Anda tidak bisa membagikannya secara publik
Saya tidak pernah menyangka akan mengatakan ini, tetapi tampaknya kita membutuhkan DRM yang lebih kuat. Sampai tingkat asal-usulnya bisa dilacak bahkan di dalam model, meski tidak jelas apakah hal seperti itu bisa ada
Selain itu, sepertinya istri Anda benar, dan obfuscation untuk LLM tampaknya tidak akan menjadi mitigasi jangka panjang
- Kalau sampai orang-orang di forum hacker favorit saya berbicara mendukung DRM, itu berarti situasinya benar-benar parah
- Untungnya DRM tidak bekerja, dan memang tidak bisa bekerja
  Kalaupun bisa, jangan berharap itu akan diterapkan untuk melindungi hak orang-orang yang bukan pihak paling kuat
- Sama sekali tidak. Kita tidak membutuhkan DRM yang lebih kuat
  Satu-satunya cara untuk mencapainya, dan itu pun pada akhirnya tetap akan dibobol, hanyalah dengan memakai enklave terenkripsi pada hardware yang dapat diverifikasi, dan itu berarti makin banyak merampas hak pengguna untuk mengendalikan perangkat mereka sendiri
- Melihat mereka sepenuhnya mengabaikan hak cipta, lisensi, dan semacamnya, sepertinya DRM sebanyak apa pun tidak akan membantu
  Dan melihat skala uang yang dibakar perusahaan-perusahaan ini setiap hari, DRM juga tampaknya tidak akan menjadi hambatan besar
  Pada akhirnya, itu mungkin hanya akan membuatnya masuk ke model yang dananya lebih besar
  Tergantung bagaimana Anda mendefinisikan DRM, obfuscation semacam ini sendiri juga bisa disebut DRM
Saya melihat Glaze sekitar satu setengah tahun lalu, dan bahkan menghubungi lab penelitinya untuk mengajukan beberapa pertanyaan klarifikasi, tetapi kalau saya ingat benar, saya tidak pernah mendapat jawaban
Dalam proses penyelidikan itu, saya melihat terlalu banyak keterbatasan dan catatan. Saya tidak tahu seperti apa state of the art terbaru sekarang, tetapi saya tidak optimistis bahwa peracunan gambar umum akan bekerja pada sebagian besar model
Pada beberapa model dan dalam beberapa kondisi, Glaze memang bekerja

Bagaimana cara menghambat pelatihan LLM pada gambar karya akhir-akhir ini?

Konteks pertanyaan

Solusi yang diinginkan

Bacaan terkait

1 komentar

Pendapat di Lobste.rs