1 poin oleh GN⁺ 1 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • Seorang pengguna menjelaskan bahwa istrinya ragu memublikasikan gambar karya secara online karena tidak ingin itu digunakan untuk pelatihan LLM
  • Inti pertanyaannya adalah apakah saat ini ada pustaka atau metode yang praktis untuk melakukan pra-pemrosesan gambar guna mengganggu pelatihan LLM
  • Pengguna ingin tahu apakah ada alat yang cukup mumpuni sehingga ia bisa membuat situs web kustom untuk istrinya sendiri
  • Ia sendiri tidak punya banyak pengalaman frontend, tetapi bisa membuat situs sederhana dengan generator situs statis
  • Ia pernah menggunakan Eleventy untuk membuat situs web band di masa lalu, jadi sedang mempertimbangkan membangun situs statis dengan cara serupa

Konteks pertanyaan

  • Istrinya tidak ingin mengunggah gambar karyanya ke internet
    • Alasannya karena ia tidak ingin gambar tersebut digunakan untuk pelatihan LLM
  • Pengguna sedang mencari apakah ada cara untuk memproses gambar karya terlebih dahulu agar pelatihan LLM menjadi lebih sulit

Solusi yang diinginkan

  • Ia sedang mempertimbangkan membuat situs web kustom sendiri untuk istrinya
  • Syarat yang dibutuhkan adalah apakah benar-benar ada pustaka atau metode untuk memproses gambar karya sehingga bisa mengganggu pelatihan LLM
  • Kondisi teknis dirinya adalah sebagai berikut
    • Tidak punya banyak pengalaman frontend
    • Bisa membuat situs sederhana dengan generator situs statis
    • Sebelumnya pernah membuat situs web band dengan Eleventy

1 komentar

 
GN⁺ 1 hari lalu
Pendapat di Lobste.rs
  • Pembaruan: sepertinya bagus untuk melihat cara
    Teman artis saya mengunggah karyanya di sana dan tampaknya puas
    Mereka mengusung artist-first, secara terbuka cenderung anti-AI, dan tampaknya juga punya integrasi Glaze untuk mencegah gambar dipakai dalam pelatihan AI
    Dan yang ingin saya katakan mungkin bukan LLM melainkan model difusi. Karena LLM menangani teks, itu mungkin membantu saat mencari informasi
    Saya ingat Nightshade, tetapi setelah cek cepat, tampaknya itu muncul sekitar 2023/24 dan saya tidak menemukan tanda-tanda repositori atau pemeliharaan

  • Masalah dengan pendekatan meracuni atau menyembunyikan karya seni yang bisa diakses LLM adalah kita tidak tahu seberapa efektifnya, dan mungkin memang tidak akan pernah tahu. Pada akhirnya semuanya masuk ke dalam kotak hitam
    Jika Anda tidak ingin karya Anda dikumpulkan oleh LLM, ada beberapa pilihan, masing-masing dengan kelebihan dan kekurangannya

    1. Jangan unggah secara online. Sangat sederhana, tetapi ini hanya berhasil jika tidak ada orang lain yang ikut mengunggahnya. Jika berupa buku, perusahaan AI juga bisa mendapatkannya lewat jalur lain seperti pemindaian
    2. Publikasikan online hanya di balik pendaftaran dan login. Orang yang berminat tetap bisa mengakses, dan LLM umum tidak bisa. Tentu ini mengandaikan tidak ada orang yang mengunggah ulang tanpa penghalang login
    3. Letakkan di balik pertahanan anti-crawler yang kuat. Agak canggung menyebut alat buatan saya sendiri, tetapi menaruh sesuatu seperti iocaine di depan situs bisa memblokir banyak crawler. Tidak semuanya, tetapi cukup untuk sangat menurunkan kemungkinan masuk ke pelatihan, dan hambatannya juga tidak terlalu besar bagi pengunjung normal
      Hal penting lain adalah, jika Anda ingin tidak masuk data pelatihan, Anda mungkin juga perlu tidak muncul di mesin pencari. Mesin pencari komersial melatih model dari materi yang mereka indeks, jadi jika sesuatu bisa ditemukan di Google Search, besar kemungkinan materi yang sama juga masuk ke Gemini
      Pada akhirnya, jika Anda ingin membuat situs portofolio tanpa pelatihan LLM, itu sulit. Jika sekadar ingin mengunggah karya secara online, penghalang login atau pertahanan anti-crawler yang kuat bisa sangat mengurangi kemungkinan dipakai untuk pelatihan. Sayangnya itu tidak bisa menjadi 0, dan tidak ada alat ajaib yang pasti bisa menyembunyikan atau meracuni karya Anda
  • Sepertinya intuisi istri Anda benar. Setidaknya secara publik, jawaban yang paling mendekati adalah jangan unggah ke internet

    • Tidak enak memang, tetapi tampaknya begitulah situasinya untuk hampir semua bentuk ekspresi kreatif manusia
      Jika Anda tidak ingin menjadi bahan bakar bagi mesin hasil generatif berkualitas rendah, Anda tidak bisa membagikannya secara publik
  • Saya tidak pernah menyangka akan mengatakan ini, tetapi tampaknya kita membutuhkan DRM yang lebih kuat. Sampai tingkat asal-usulnya bisa dilacak bahkan di dalam model, meski tidak jelas apakah hal seperti itu bisa ada
    Selain itu, sepertinya istri Anda benar, dan obfuscation untuk LLM tampaknya tidak akan menjadi mitigasi jangka panjang

    • Kalau sampai orang-orang di forum hacker favorit saya berbicara mendukung DRM, itu berarti situasinya benar-benar parah
    • Untungnya DRM tidak bekerja, dan memang tidak bisa bekerja
      Kalaupun bisa, jangan berharap itu akan diterapkan untuk melindungi hak orang-orang yang bukan pihak paling kuat
    • Sama sekali tidak. Kita tidak membutuhkan DRM yang lebih kuat
      Satu-satunya cara untuk mencapainya, dan itu pun pada akhirnya tetap akan dibobol, hanyalah dengan memakai enklave terenkripsi pada hardware yang dapat diverifikasi, dan itu berarti makin banyak merampas hak pengguna untuk mengendalikan perangkat mereka sendiri
    • Melihat mereka sepenuhnya mengabaikan hak cipta, lisensi, dan semacamnya, sepertinya DRM sebanyak apa pun tidak akan membantu
      Dan melihat skala uang yang dibakar perusahaan-perusahaan ini setiap hari, DRM juga tampaknya tidak akan menjadi hambatan besar
      Pada akhirnya, itu mungkin hanya akan membuatnya masuk ke model yang dananya lebih besar
      Tergantung bagaimana Anda mendefinisikan DRM, obfuscation semacam ini sendiri juga bisa disebut DRM
  • Saya melihat Glaze sekitar satu setengah tahun lalu, dan bahkan menghubungi lab penelitinya untuk mengajukan beberapa pertanyaan klarifikasi, tetapi kalau saya ingat benar, saya tidak pernah mendapat jawaban
    Dalam proses penyelidikan itu, saya melihat terlalu banyak keterbatasan dan catatan. Saya tidak tahu seperti apa state of the art terbaru sekarang, tetapi saya tidak optimistis bahwa peracunan gambar umum akan bekerja pada sebagian besar model
    Pada beberapa model dan dalam beberapa kondisi, Glaze memang bekerja