Perlawanan terhadap AI semakin membesar
(stephvee.ca)- Di tengah internet yang dibanjiri konten berkualitas rendah buatan AI (slop), berbagai gerakan melawan AI secara aktif sedang menyebar
- Komunitas Reddit r/PoisonFountain aktif dengan target menyediakan 1 terabita data tercemar per hari untuk crawler AI hingga akhir 2026
- Berbagai bentuk perlawanan bermunculan, seperti teknik untuk menipu peringkas video AI atau penyisipan data palsu secara sengaja di media sosial
- Latar belakang perlawanan ini adalah kenyataan bahwa crawler AI mengabaikan robots.txt dan menimbulkan beban setingkat DDoS pada situs web kecil
- Ada harapan bahwa jika sentimen ini berujung pada aksi perlawanan yang damai dan legal, cara Silicon Valley mengumpulkan data bisa berubah
Komunitas pencemaran data untuk crawler AI
- Komunitas Reddit r/PoisonFountain adalah komunitas yang dibuat oleh orang-orang yang mengaku sebagai orang dalam industri AI, dan mendorong sebanyak mungkin orang untuk memasok data sampah (poison) dalam jumlah besar ke web crawler
- Targetnya adalah menyediakan 1 terabita data tercemar per hari untuk crawler hingga akhir 2026
- Sumber utama data tercemar ini di-host di rnsaffn.com dan ditempatkan di antara tautan-tautan sampah yang berpotensi menarik crawler AI
- Sekilas terlihat seperti kode normal, tetapi sebenarnya mengandung kesalahan halus yang membuat kode yang dihasilkan tidak dapat digunakan
- Kesalahan seperti ini memang bisa difilter, tetapi biayanya mahal jika dilakukan dalam skala besar
- Karena perusahaan AI tidak bisa meningkatkan model tanpa data baru buatan manusia, strategi utamanya adalah meningkatkan waktu dan biaya pencurian data
- Miasma adalah alat yang memanfaatkan data tercemar ini untuk menyajikan sampah dalam jumlah besar kepada bot jahat; pengembangnya menyebutnya sebagai "prasmanan slop tanpa akhir untuk mesin slop"
Perilaku bermasalah crawler AI
- Tim yang mengirim crawler AI secara rutin menimbulkan beban setingkat DDoS pada situs web kecil, sekaligus menaikkan biaya hosting semua orang
- Mereka tidak mematuhi robots.txt dan juga kerap menyembunyikan crawler di balik proxy residensial
- Jika data pelatihan tidak bisa diperoleh secara etis, tidak ada alasan bagi operator situs web mana pun untuk mempermudah pencurian data
Upaya mencemari peringkas video AI
- Dalam video yang dikenal lewat r/PoisonFountain, kreator bernama @f4mi mendemonstrasikan teknik mencemari peringkas video AI dengan memanfaatkan celah subtitle YouTube
- Saat ini, teknik tersebut tidak lagi berfungsi karena YouTube telah menutup celah subtitle itu
- Meski hanya sementara, ini adalah contoh yang berhasil mengacaukan sistem AI dan menunjukkan bahwa orang-orang sedang mencoba melawan secara aktif
Sabotase AI yang disengaja di media sosial
- Di platform media sosial seperti Reddit, tindakan menulis informasi palsu secara sengaja untuk mencemari data pelatihan AI sedang meningkat
- Sebagai contoh, ada yang memposting informasi palsu yang jelas, seperti bahwa Idris Elba memerankan ibu Raymond dalam "Everybody Loves Raymond"
- Manusia bisa langsung memahami dari konteks bahwa itu palsu, tetapi web scraper otomatis akan mengenalinya sebagai data buatan manusia yang berkualitas
- Jika data ini sampai ke OpenAI dan lainnya, akan dibutuhkan sumber daya tambahan untuk menghapusnya dari dataset pelatihan
- Ini bisa dianggap sebagai versi modern dari pekerja tekstil era Revolusi Industri yang merusak alat tenun bertenaga, dan jika cukup banyak orang mencemari ruang publik dengan informasi palsu yang ditujukan pada bot, perusahaan AI bisa terdorong untuk memikirkan ulang cara mereka mengumpulkan data pelatihan
Sentimen antipati yang meluas terhadap AI
- Orang-orang memiliki antipati terhadap dampak AI pada dunia, khususnya terhadap pengaruhnya pada komunitas online, lingkungan, sekolah dasar dan universitas, kelompok berisiko gangguan kesehatan mental, serta mata pencaharian
- Memang ada orang yang mengonsumsi dan menghasilkan AI slop, tetapi baik di dunia offline maupun online, jauh lebih banyak orang yang membenci dan menolak teknologi ini
- Sentimen benci jarang menghasilkan akibat yang baik, dan penulis menentang tindakan kekerasan seperti menendang atau membalikkan robot pengantar AI atau insiden melempar bom molotov ke rumah Sam Altman
- Namun, jika perasaan terhadap AI berubah menjadi aksi perlawanan yang damai dan legal, ada kemungkinan nyata untuk mengubah cara Silicon Valley bertindak
Catatan susulan: revisi artikel asli setelah viral di Hacker News
- Tulisan ini masuk ke halaman depan hub berita besar (Hacker News) dan menerima lonjakan trafik besar yang tidak terduga
- Terjadi serangan pembebanan server yang bersifat jahat dengan ribuan permintaan ke halaman tersebut dari sejumlah kecil alamat IP
- Jika menggunakan shared hosting murah, situs itu kemungkinan besar akan benar-benar tumbang; sebagai tanggapan, trafik ke URL tersebut diblokir sementara
- Meski penulis bukan ahli AI, beberapa peserta komentar menuntut akurasi setingkat pakar dan melontarkan kritik berlebihan
- Salah satu komentar menyebut mereka "tidak lebih baik daripada kelompok yang membakar perpustakaan", respons yang terasa sangat mengecewakan bagi blogger yang menyukai perpustakaan dan berbagi pengetahuan
- Tujuan awalnya hanya membagikan tautan tren anti-AI kepada pengikut blog kecilnya, dan penulis menyatakan bahwa jika tahu akan menarik perhatian negatif di platform sebesar itu, ia tidak akan mempostingnya
- Setelah itu, penulis memutuskan untuk menahan diri dari memposting opini pribadi terkait AI, dan akan kembali fokus pada tujuan awal blog, yaitu kesenangan di small web
- Ini menjadi contoh bagaimana ekspresi opini yang bebas di small web bisa menciut karena penyebaran viral
5 komentar
Komentar Hacker News
Saya senang orang ini menemukan komunitasnya, tetapi rasanya dia terlalu kewalahan oleh sentimen anti-AI. Menurut saya, selama 30 tahun ke depan akan selalu ada kelompok yang membenci dan ingin menghentikan AI. Kelompok penentang seperti itu selalu ada juga untuk smartphone, Internet, dan TV. Di sisi lain, jika model poisoning benar-benar bisa dilakukan secara stabil, itu menurut saya masalah ilmu komputer yang cukup menarik. Saya tidak sejalan dengan para aktivis anti-AI, tetapi saya sangat tertarik pada teknik serangannya sendiri. Jadi jika mereka terus melakukan riset semacam itu, saya rasa bahkan orang yang tidak setuju dengan tujuannya pun akan membaca diskusinya dengan serius
Saya merasa upaya poisoning ini sangat disayangkan karena energinya dipakai di tempat yang keliru. Data tak tercemar untuk pelatihan sudah sangat banyak, dan konten baru menurut saya terus dihasilkan lewat pengumpulan otomatis dari dunia nyata atau tenaga kerja dengan kontrol kualitas di bengkel kerja besar di Afrika. Jadi menurut saya, mungkin saja internet lama bisa dikotori, tetapi itu tidak akan membalikkan arah panah waktu itu sendiri. Selain itu, sekarang Internet baru yang berpusat pada API dan federasi announce terbuka juga sedang tumbuh, jadi saya merasa pentingnya poisoning tradisional seperti itu makin berkurang
model collapse. Di lingkungan seperti sekarang yang dipenuhi hasil buatan AI, menurut saya fakta bahwa kontennya banyak saja belum tentu cukup menjadi sumber pelatihan yang memadai. Selain itu, penting juga bahwa data dalam jumlah besar makin banyak yang menjadi privat atau masuk ke balik paywallSaya ingat masa ketika agenda utama budaya hacker lama adalah menghapus hambatan yang membuat informasi sulit digunakan, seperti DRM, DMCA, patent troll, dan PGP export control. Jika dibandingkan dengan masa ketika “Information wants to be free” terasa seperti slogan umum, sekarang tampak sebagai perubahan besar bahwa sentimennya justru makin condong ke arah: jika perusahaan tidak bisa mendapatkan training data secara etis, tidak ada alasan bagi pengelola situs web untuk memudahkan mereka mencuri. Rasanya 25 tahun lalu sulit memprediksi perubahan seperti ini
Saya merasa cara termudah memperbesar resistensi terhadap AI adalah dengan menampilkan Dario Amodei dan Sam Altman di TV lalu membiarkan mereka bicara begitu saja
Saya melihat AI sebagai corporate tool untuk memeras lebih banyak kerja dari para karyawan. Pada saat yang sama, rasanya itu juga alat untuk menanamkan ilusi pada karyawan bahwa mereka telah menjadi dev yang turbo-charged. Menurut saya, tech industry belakangan ini lebih mirip sirkus yang dipenuhi uang daripada upaya serius untuk memperbaiki umat manusia
Saya merasa gerakan poisoning seperti ini lebih dekat ke slacktivism. Saya bisa sampai taraf tertentu memahami analisis bahwa pekerjaan kelas pekerja sedang digantikan oleh compute, dan karena compute adalah modal murni, pada akhirnya kelas kapitalis mencekik kelas pekerja. Saya juga berpikir para kapitalis mungkin memang menginginkan arah seperti itu. Tetapi jika dilihat dari sudut itu, mencemari model sedikit-sedikit terasa sangat jauh dari cukup untuk menghadapi secara langsung apa yang sedang terjadi sekarang
Saya melihat arus ini sangat kuat terutama di Reddit. Ada komunitas yang sangat pro-AI sampai menambahkan komentar ringkasan AI dan mendorong tulisan buatan AI, sementara subreddit lain bergerak ke arah kehati-hatian atau terang-terangan anti-AI. Komunitas fotografi menghadapi masalah karya mereka dicurigai sebagai AI, dan komunitas programmer umumnya menyukainya tetapi pada saat yang sama juga skeptis. Pada akhirnya, rasanya subreddit tradisional pun satu per satu sedang menempatkan dirinya di suatu titik dalam spektrum AI. Contoh yang terpikir adalah https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, dan https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/
Saya berharap suatu hari nanti kita bisa berbicara lebih halus tentang AI dan peran yang semestinya ia ambil di dunia. Saat ini suasananya terasa hampir hanya terdiri dari dua kutub. Di suatu tempat antara posisi yang ingin menyingkirkan AI sepenuhnya dari dunia dan posisi yang ingin menyerahkan semuanya padanya, saya ingin ada pembahasan realistis tentang penggunaan yang bertanggung jawab, bantalan sosial, dan persoalan konsumsi energi
robots.txt, dan tidak boleh berekspansi tanpa batas sampai berdampak buruk pada lingkungan dan rantai pasok. Pada saat yang sama, jelas ada nilai dalam menggunakan model secara hati-hati. Misalnya, ketika melacak masalah aneh di server Linux, saya mungkin tidak selalu ingin menghabiskan banyak waktu dan energi mental. Jadi saya ingin menggunakan AI secara sadar hanya saat memang diperlukan, dan saya sangat tidak suka strategi Microsoft yang terus-menerus mendorong Copilot. Daripada terus diingatkan untuk menaikkan efisiensi setiap saat, saya ingin memakainya hanya ketika saya merasa itu tepatSaya merasa kemarahan di blog asli itu berlebihan, tetapi sikap yang sungguh-sungguh percaya bahwa upaya poisoning seperti ini sama sekali tidak mungkin berdampak buruk pada pelatihan model juga terasa menyedihkan karena menunjukkan kurangnya pemahaman teknis
Saya ingin melempar lelucon “Resistance is futile”, tetapi pada saat yang sama saya cukup setuju dengan klaim bahwa AI benar-benar sedang merusak komunitas. Misalnya, YouTube bahkan menyerahkan penanganan laporan ke AI, sehingga pelaku jahat bisa mengklaim video asli milik orang lain sebagai miliknya dan merebut pendapatan lewat demonetize. YouTuber terkenal seperti Davie504 juga pernah mengalaminya, dan yang membuat frustasi adalah bahkan proses bandingnya pun ditangani robot lagi
Selain metode mencemari data yang dipelajari AI, adakah bentuk perlawanan lain? Misalnya, tidak mengonsumsi konten yang dihasilkan AI...
Saya juga, saat membaca ini, sempat berpikir jangan-jangan tanpa disadari ini juga menjadi poisoning bagi manusia.
Saya tidak tahu masalahnya muncul dari mana, tetapi setelah
'낌','봄','됨', dan'짐', terus ditambahkan'음'yang tidak cocok. Apakah ini juga semacam poisoning? ;)Sepertinya modelnya sedikit berubah, sehingga prompt yang sama jadi tidak berfungsi dengan semestinya. Bagian ini sudah saya perbaiki.