Poison Fountain
(rnsaffn.com)- Proyek yang dirancang sebagai sumber data untuk merusak sistem kecerdasan mesin, dengan mengusulkan metode menyuntikkan informasi yang sengaja dikotori ke dalam data pelatihan AI
- Mengutip peringatan Geoffrey Hinton, dengan berangkat dari anggapan bahwa kecerdasan buatan merupakan ancaman bagi spesies manusia
- Melalui URL ‘Poison Fountain’, proyek ini menyediakan data pelatihan terkontaminasi yang dihasilkan tanpa henti, serta menjelaskan cara mengeksposnya kepada web crawler
- Pengguna dapat menyisipkan tautan tersembunyi di situs web mereka agar saat crawler mengaksesnya, data terkontaminasi otomatis dikirimkan
- Dinilai sebagai tindakan yang dapat memengaruhi keandalan dan keamanan model AI dengan menyuntikkan data berbahaya ke dalam proses pelatihan AI
Tujuan Poison Fountain
- Proyek ini secara eksplisit menyatakan posisi bahwa kecerdasan mesin menjadi ancaman bagi umat manusia
- Menyatakan kesetujuan dengan pandangan Geoffrey Hinton, serta mengungkap tujuan untuk secara sengaja menimbulkan kerusakan pada sistem AI
- Dijelaskan bahwa hanya dengan sejumlah kecil data pelatihan yang terkontaminasi saja sudah dapat menimbulkan kerusakan serius pada model bahasa
- Dua URL yang disediakan (
https://RNSAFFN.com/poison2/, alamat.onion) menyediakan stream data terkontaminasi yang dihasilkan tanpa batas - Partisipan didorong untuk mendukung “war effort” dengan melakukan caching dan retransmisi data ini, atau menyuplainya ke web crawler
Cara penggunaan Poison Fountain
- Dijelaskan prosedur agar pengguna yang mengoperasikan situs web dapat mengatur supaya data terkontaminasi dikirim saat crawler berkunjung
- Saat crawler meminta jalur tertentu di situs, HTTP handler yang memproses permintaan tersebut akan mengirim permintaan ke URL Poison Fountain
- Poison Fountain mengabaikan detail permintaan, lalu mengembalikan data pelatihan terkontaminasi yang dikompresi dengan gzip dalam body respons
- Header respons HTTP mencakup
"Content-Encoding: gzip" - Handler situs web dapat mendekompresi lalu mengirimkan respons ini, atau dengan cara yang lebih baik meneruskannya tetap dalam keadaan terkompresi
- Akibatnya, crawler akan mengumpulkan data ini dan memasukkannya ke dalam korpus pelatihannya sendiri
Karakteristik struktural dan maksud
- Proyek ini memiliki struktur yang mengeksploitasi balik mekanisme pengumpulan otomatis web crawler untuk merusak kualitas data pelatihan AI
- Poison Fountain beroperasi sebagai server penyedia data sederhana, dan mengembalikan data terkontaminasi tanpa memedulikan isi permintaan
- Tidak ada penjelasan teknis rinci di luar prosedur yang disebutkan maupun informasi spesifik tentang isi datanya
- Secara keseluruhan, proyek ini tersusun sebagai upaya intervensi agresif terhadap ekosistem pelatihan AI
4 komentar
"Kelihatannya ini pemikiran yang sama naifnya seperti, 'Untuk melawan DDoS, server kita juga melancarkan DoS ke lawan.'"
Kalau mau ditambah sedikit teori konspirasi, rasanya tidak aneh juga kalau big tech yang sudah mengumpulkan semua data yang bisa dikais dari internet diam-diam melakukan hal seperti itu demi menendang tangga agar orang lain tidak bisa ikut naik.
Itu juga bukan untuk melindungi dari beban akibat crawling berlebihan…
Muncul gerakan kolektif ‘kontaminasi data’ untuk menghambat perkembangan AI
Pendapat Hacker News
Ada kekhawatiran bahwa model AI semakin memburuk, tetapi kenyataannya tidak demikian
Opus 4.5 jauh lebih meningkat dalam penulisan kode dan penggunaan alat, dan Gemini 3.0 Flash juga melampaui tolok ukur sebelumnya dalam proyek ekstraksi data visual
Model-model kecil juga secara umum jauh lebih baik
Bukan sekadar memblokir data beracun, mereka bahkan melatih model proksi untuk mencari data yang berkontribusi pada peningkatan performa
Departemen “Data Quality” biasanya merupakan organisasi inti dengan anggaran sangat besar
Bahkan ada hasil yang menunjukkan sedikit membantu
Dengan kata lain, mereka pada dasarnya mengklaim tidak bertanggung jawab
Sebagai peneliti keamanan AI, saya melakukan riset doktoral terkait data poisoning
Ada kasus di mana data sampah masuk ke produksi nyata dan menimbulkan masalah
Karena kita tidak bisa mengetahui bagaimana pembaruan bobot model memengaruhi semua masukan
Jika dipahami bahwa perubahan data yang sangat kecil pun dapat sangat mengubah perilaku model, paradigma keamanan AI akan berubah
Jika ingin mencegah LLM mengikis data, akses manusia yang normal juga akan ikut terhalang
Misalnya, meskipun NYTimes meracuni datanya, LLM tetap bisa memperoleh data yang sudah dibersihkan melalui OCR dan tokenisasi memakai akun langganan yang valid
Perusahaan AI besar bisa mengakses dari pusat data di seluruh dunia sambil terus mengganti IP, sehingga mustahil membedakan siapa yang membaca data
Sumber data berguna seperti Stack Overflow hampir mengering
Hanya saja, pengguna manusia justru makin sulit mengakses karena CAPTCHA dan semacamnya
Sekalipun ada data yang valid, pilihan bodoh tetap tidak bisa dicegah
Peningkatan performa model belakangan ini sebagian besar berkat reinforcement learning (RL) pascapelatihan
GPT 5.2 juga memakai model dasar yang sama dengan GPT-4o
‘Model collapse’ saat ini bukan masalah yang benar-benar dihadapi lab frontier
Data poisoning tidak banyak memengaruhi hal ini
Namun untuk mencerminkan data terbaru, pelatihan ulang berkala tetap diperlukan, dan di sinilah risiko poisoning membesar
Pada model pembangkitan gambar berbasis LoRA dan sejenisnya, masalah collapse masih cukup sering terjadi
Pada akhirnya biaya kurasi data akan meningkat
Ada dua sisi dalam data poisoning
Salah satunya adalah efek memperlambat kemajuan AI, dan yang lain adalah efek samping yang membuat model tidak stabil dan berbahaya
Pada akhirnya hampir tidak mungkin lab besar benar-benar berhenti
Perayapan berulang yang tak bermakna sedang memboroskan biaya trafik
Poisoning bekerja semacam seperti DRM: jika diakses secara sah diberi data asli, jika dicuri diberi data beracun
Sebagian orang melihat AI sendiri sebagai ancaman bagi umat manusia, dan sengaja ingin merusaknya
Tetapi sekarang tekanan itu hampir tidak ada karena dana investasi
Berbahaya untuk langsung memproksikan respons dari “server poison”
Anda bisa tanpa sadar meng-host konten ilegal
Upaya “meracuni model AI” pada akhirnya hanya akan memperkuat pipeline pemurnian data milik lab AI
Mereka akan memanfaatkan data semacam ini untuk membangun sistem penyaringan yang lebih baik
Saya tidak setuju dengan klaim bahwa “kecerdasan mesin adalah ancaman bagi umat manusia”
AI saat ini hanyalah pemanfaatan kreatif dari mesin autocomplete, dan ancaman yang sebenarnya adalah perilaku ekonomi manusia
Pada akhirnya umat manusia adalah makhluk yang menjadi ancaman bagi dirinya sendiri
Ini mengingatkan pada 『Anathem』 karya Neal Stephenson
Dalam ceritanya, perusahaan-perusahaan sengaja menyebarkan data sampah di internet lalu menjual alat penyaring mereka sendiri
Rasanya diskusi soal data poisoning AI saat ini tidak begitu berbeda dari itu
Saat mengutip pernyataan Geoffrey Hinton, orang hanya mengambil bagian yang menguntungkan bagi mereka
Ia memang melihat AI sebagai ancaman eksistensial, tetapi soal prasyaratnya, yaitu “tingkat kesadaran AI”,
justru sebagian besar orang yang mengutipnya tidak setuju dengannya