- Seorang pengguna menjelaskan bahwa istrinya ragu memublikasikan gambar karya secara online karena tidak ingin itu digunakan untuk pelatihan LLM
- Inti pertanyaannya adalah apakah saat ini ada pustaka atau metode yang praktis untuk melakukan pra-pemrosesan gambar guna mengganggu pelatihan LLM
- Pengguna ingin tahu apakah ada alat yang cukup mumpuni sehingga ia bisa membuat situs web kustom untuk istrinya sendiri
- Ia sendiri tidak punya banyak pengalaman frontend, tetapi bisa membuat situs sederhana dengan generator situs statis
- Ia pernah menggunakan Eleventy untuk membuat situs web band di masa lalu, jadi sedang mempertimbangkan membangun situs statis dengan cara serupa
Konteks pertanyaan
- Istrinya tidak ingin mengunggah gambar karyanya ke internet
- Alasannya karena ia tidak ingin gambar tersebut digunakan untuk pelatihan LLM
- Pengguna sedang mencari apakah ada cara untuk memproses gambar karya terlebih dahulu agar pelatihan LLM menjadi lebih sulit
Solusi yang diinginkan
- Ia sedang mempertimbangkan membuat situs web kustom sendiri untuk istrinya
- Syarat yang dibutuhkan adalah apakah benar-benar ada pustaka atau metode untuk memproses gambar karya sehingga bisa mengganggu pelatihan LLM
- Kondisi teknis dirinya adalah sebagai berikut
- Tidak punya banyak pengalaman frontend
- Bisa membuat situs sederhana dengan generator situs statis
- Sebelumnya pernah membuat situs web band dengan Eleventy
1 komentar
Pendapat di Lobste.rs
Pembaruan: sepertinya bagus untuk melihat cara
Teman artis saya mengunggah karyanya di sana dan tampaknya puas
Mereka mengusung artist-first, secara terbuka cenderung anti-AI, dan tampaknya juga punya integrasi Glaze untuk mencegah gambar dipakai dalam pelatihan AI
Dan yang ingin saya katakan mungkin bukan LLM melainkan model difusi. Karena LLM menangani teks, itu mungkin membantu saat mencari informasi
Saya ingat Nightshade, tetapi setelah cek cepat, tampaknya itu muncul sekitar 2023/24 dan saya tidak menemukan tanda-tanda repositori atau pemeliharaan
Masalah dengan pendekatan meracuni atau menyembunyikan karya seni yang bisa diakses LLM adalah kita tidak tahu seberapa efektifnya, dan mungkin memang tidak akan pernah tahu. Pada akhirnya semuanya masuk ke dalam kotak hitam
Jika Anda tidak ingin karya Anda dikumpulkan oleh LLM, ada beberapa pilihan, masing-masing dengan kelebihan dan kekurangannya
Hal penting lain adalah, jika Anda ingin tidak masuk data pelatihan, Anda mungkin juga perlu tidak muncul di mesin pencari. Mesin pencari komersial melatih model dari materi yang mereka indeks, jadi jika sesuatu bisa ditemukan di Google Search, besar kemungkinan materi yang sama juga masuk ke Gemini
Pada akhirnya, jika Anda ingin membuat situs portofolio tanpa pelatihan LLM, itu sulit. Jika sekadar ingin mengunggah karya secara online, penghalang login atau pertahanan anti-crawler yang kuat bisa sangat mengurangi kemungkinan dipakai untuk pelatihan. Sayangnya itu tidak bisa menjadi 0, dan tidak ada alat ajaib yang pasti bisa menyembunyikan atau meracuni karya Anda
Sepertinya intuisi istri Anda benar. Setidaknya secara publik, jawaban yang paling mendekati adalah jangan unggah ke internet
Jika Anda tidak ingin menjadi bahan bakar bagi mesin hasil generatif berkualitas rendah, Anda tidak bisa membagikannya secara publik
Saya tidak pernah menyangka akan mengatakan ini, tetapi tampaknya kita membutuhkan DRM yang lebih kuat. Sampai tingkat asal-usulnya bisa dilacak bahkan di dalam model, meski tidak jelas apakah hal seperti itu bisa ada
Selain itu, sepertinya istri Anda benar, dan obfuscation untuk LLM tampaknya tidak akan menjadi mitigasi jangka panjang
Kalaupun bisa, jangan berharap itu akan diterapkan untuk melindungi hak orang-orang yang bukan pihak paling kuat
Satu-satunya cara untuk mencapainya, dan itu pun pada akhirnya tetap akan dibobol, hanyalah dengan memakai enklave terenkripsi pada hardware yang dapat diverifikasi, dan itu berarti makin banyak merampas hak pengguna untuk mengendalikan perangkat mereka sendiri
Dan melihat skala uang yang dibakar perusahaan-perusahaan ini setiap hari, DRM juga tampaknya tidak akan menjadi hambatan besar
Pada akhirnya, itu mungkin hanya akan membuatnya masuk ke model yang dananya lebih besar
Tergantung bagaimana Anda mendefinisikan DRM, obfuscation semacam ini sendiri juga bisa disebut DRM
Saya melihat Glaze sekitar satu setengah tahun lalu, dan bahkan menghubungi lab penelitinya untuk mengajukan beberapa pertanyaan klarifikasi, tetapi kalau saya ingat benar, saya tidak pernah mendapat jawaban
Dalam proses penyelidikan itu, saya melihat terlalu banyak keterbatasan dan catatan. Saya tidak tahu seperti apa state of the art terbaru sekarang, tetapi saya tidak optimistis bahwa peracunan gambar umum akan bekerja pada sebagian besar model
Pada beberapa model dan dalam beberapa kondisi, Glaze memang bekerja