- Proyek blacklist publik untuk memblokir situs pabrik konten yang dibuat AI di uBlock Origin
- Situs web yang ditulis oleh AI generatif sering kali dipenuhi iklan dan tautan afiliasi, serta memuat informasi yang tidak dapat dipercaya
- Pengguna dapat menerapkan daftar blokir dengan berlangganan file
list.txt atau menambahkan URL secara manual
- Ciri-ciri dan kriteria identifikasi situs buatan AI dijelaskan secara rinci, dan daftar dapat diperluas melalui Pull Request dari para kontributor
- Dapat digunakan sebagai alat praktis untuk mengurangi polusi konten AI yang muncul di peringkat atas hasil pencarian
Ringkasan proyek
- AI uBlock Blacklist menyediakan daftar pemblokiran konten buatan AI yang dapat digunakan di ekstensi uBlock Origin
- Situs web yang ditulis AI generatif ditambahkan ke daftar secara manual setiap kali ditemukan saat menjelajah
- Tidak menggunakan alat otomatis, dan disebutkan bahwa sulit menentukan apakah suatu konten dibuat AI hanya dengan algoritme
Tujuan proyek
- Situs web yang ditulis AI generatif memiliki sedikit informasi berguna dan dirancang untuk mencari keuntungan lewat iklan serta tautan afiliasi
- Konten yang ditulis AI bisa dipublikasikan massal tanpa peninjauan dan dapat memuat informasi berbahaya
- Sebagai contoh, disebut kemungkinan memberi saran berbahaya seperti korsleting rangkaian, menjalankan perintah
rm -rf /, atau mencampur pemutih dengan amonia
- Karena alasan ini, konten buatan AI dianggap tidak dapat dipercaya dan perlu diblokir
- Pembuat proyek berkebangsaan Italia sehingga banyak situs berbahasa Italia masuk dalam daftar, dan kontribusi untuk menambahkan situs dari bahasa lain sangat disambut
Cara menambahkan situs web
- Pengguna tanpa pengetahuan teknis dapat melaporkan situs yang mencurigakan melalui GitHub Issue
- Jika menambahkan langsung melalui Pull Request, pemblokiran bisa dilakukan pada level domain atau jalur blog tertentu
- Contoh:
||example.com/@slopUser^$doc atau format ||example.com^$doc
- Jika organisasi yang menjual layanan SEO dan pemasaran digital mengoperasikan beberapa content farm, disarankan menambahkan situs terkait sekaligus
Kriteria identifikasi content farm AI
- Pendahuluan dan penutup yang tidak perlu, judul bombastis seperti ‘Comprehensive Guide’, tidak ada tautan eksternal atau sumber, serta banyak tautan afiliasi
- Ribuan posting dalam waktu singkat, informasi salah (halusinasi), posting setelah November 2022, serta gambar dan logo buatan AI
- Teks dengan format yang berantakan, sintaks Markdown yang tidak dirender, teks panjang yang tidak relevan dengan topik, serta muncul berulang di hasil pencarian atas
- Tidak ada informasi kontak, halaman perkenalan yang samar, dan konten yang memuja AI juga disebut sebagai ciri utama
Pemanfaatan Google Dorks
- Jika AI memposting kalimat yang disalin apa adanya, halaman buatan AI dapat ditemukan lewat pencarian frasa tertentu
- Contoh:
"Sure! Here's an article about" (Inggris), "Certo! Ecco un articolo" (Italia)
- Halaman yang memuat frasa seperti ini akan membuat seluruh domain ditambahkan ke blacklist
Proyek serupa
1 komentar
Pendapat Hacker News
Ide ini menarik dan saya juga sempat ingin berkontribusi ke daftar tersebut, tetapi saya berhenti setelah melihat frasa “Cry about it” di FAQ
Menurut saya, sikap seperti ini tidak pantas untuk cara mengelola blacklist publik. Kesan yang muncul adalah maintainernya menganggap dirinya tidak mungkin salah
Saya sudah meminta penghapusan, tetapi tidak pernah mendapat balasan, dan sampai sekarang masih diblokir
Dengan pendekatan yang lebih realistis, muncul daftar baru yang hanya memblokir content farm atau situs berkualitas rendah
Ini tampak sebagai alternatif yang lebih baik daripada daftar pemblokiran AI lama yang terlalu luas
Lihat uBlockOrigin-HUGE-AI-Blocklist
Di Reddit juga ada diskusi terkait yang cukup aktif
Saya membagikan proses pencarian dan daftarnya di gist saya
Seiring waktu, masalah false positive makin serius. Domain bisa dijual, situs bisa berganti arah, atau kontennya bisa dihapus
Dengan sikap seperti “Cry about it”, ini hanya akan menjadi lubang hitam pencemaran nama baik. Setidaknya perlu ada mekanisme kedaluwarsa atau peninjauan ulang
uBlock Origin sendiri sudah punya daftar pemblokiran “AI widget”. Fitur ini yang membuat saya masih memakai Firefox. Di Chromium sudah tidak berguna
Saya setuju dengan prinsipnya, tetapi sikap seperti “menulis dengan AI itu masalah skill” terasa tidak adil bagi pengguna Grammarly atau penutur non-Inggris
Lagi pula proyek ini menargetkan content farm, bukan penulis individu, jadi pokok bahasannya berbeda
Sepertinya penulis ini memang membidik farm bot AI
Meski begitu, internet setidaknya belum sampai punya whitelist
Ada yang memakai alat untuk menilai apakah tulisan dibuat AI berdasarkan tropes, lalu merekonstruksi prompt aslinya
tropes.fyi/aidr
Arah seperti ini bagus. Akan lebih baik kalau pemblokiran berdasarkan kategori situs bisa dibuat lebih beragam
Di lingkungan perusahaan, layanan reputasi URL digunakan untuk mengategorikan situs dan mengendalikan akses
Menurut saya, pengguna individu juga butuh infrastruktur semacam ini yang didukung crowdfunding
Misalnya, akan bagus kalau ada dana nirlaba senilai 1 miliar dolar per tahun untuk mendukung ekosistem tepercaya seperti browser, VPN, DNS, email, dan otoritas sertifikat
Ada juga ekstensi seperti botblock.ai yang mendeteksi balasan AI di Twitter
Bukti gambar
Kalau iklannya terlalu banyak, saya biasanya langsung menutup situsnya. Kalau susunan iklannya masih masuk akal, saya tetap memakainya
Saya sudah lelah dengan perang adblock. Setiap saat muncul nama plugin baru, terasa seperti persaingan tanpa akhir