FSE bertemu FBI
(blog.freespeechextremist.com)- Server FSE (Freespeech Extremist) membagikan pengalamannya menjadi target pengumpulan data oleh FBI
- FBI membayar vendor swasta (seperti SocialGist) untuk melakukan scraping besar-besaran atas berbagai forum dan data fediverse, lalu memanfaatkannya untuk analisis konten, klasifikasi berbasis kata kunci, dan analisis sentimen
- Dalam proses pengoperasian server, dijelaskan pengalaman mendeteksi pengguna jahat, know-how analisis dan pelacakan trafik, serta penanganan data poisoning maupun crawling tidak langsung
- Perusahaan pengumpul data seperti BoardReader terus memindai server dengan crawling agresif dan penghindaran via proxy, dan keterkaitannya dengan data FBI juga terungkap
- Melalui kasus ini, ditekankan perlunya operator server fediverse dan industri TI meningkatkan keamanan data, kemampuan observasi, dan respons
FSE bertemu FBI
Pete, 6 April 2025
Ringkasan dan perkembangan kejadian
- Administrator FSE (Freespeech Extremist) membagikan pengalaman aneh terkait UGC server, crawler, dan pengumpulan data oleh lembaga investigasi federal secara menyeluruh
- Ia menganalisis titik kontak nyata dengan FBI, serta bagaimana data di-scrape lalu benar-benar masuk ke sistem internal lembaga penegak hukum dan antarmuka pengorganisasian berbasis Facebook
- Isi utama tulisan ini mencakup analisis log server, penanganan pengguna berbahaya, metodologi deteksi anomali trafik, pendekatan penghindaran oleh perusahaan scraping data, dan kaitan mereka dengan penegak hukum
Akar kejadian – ancaman konten ilegal
- Masuknya pelaku kejahatan seksual terhadap anak ke dalam fediverse merupakan risiko paling serius yang mengancam keberadaan server itu sendiri
- FSE dikelola dengan menekankan kebebasan berekspresi, tetapi jika terjadi tindakan ilegal, semuanya dicatat dengan teliti lalu diblokir dan dipublikasikan secara aktif
- Perlu juga mewaspadai pemblokiran palsu dari instance lain dan distorsi informasi akibat kesalahpahaman, serta struktur yang memungkinkan data berpindah ke lembaga intelijen eksternal (misalnya FBI)
Respons teknis dan crash course analisis log
Diagnosis tanda-tanda anomali dalam operasi server
- Karena keterbatasan perangkat lunak server, trafik tidak normal, serta crawler/bot/scanner, server publik selalu terpapar pada hal-hal yang ‘aneh’
- Untuk merespons secara efektif, perlu menguasai alat analisis teks dan jaringan seperti awk, tail -f, whois, tcpdump, traceroute, Shodan
- Diperkenalkan cara memahami aliran data secara real-time, seperti kustomisasi format log web server (TSV dan semacamnya), pencatatan waktu respons per resource, dan deteksi nilai anomali
- Dengan memanfaatkan analisis statistik sederhana (rata-rata, deviasi standar, peringatan outlier), situasi abnormal seperti DDoS atau crawling dapat diidentifikasi
‘Jaringan parut’ yang terbentuk dari pengalaman dan langkah penanganan
- Pada awalnya, mereka menghadapi isu spammer biasa dan pendaftaran otomatis
- Untuk mencegah registrasi massal, mereka membuat dan mengoperasikan alat ringan sendiri seperti email yang terhubung dengan log, notifikasi suara, dan rate limit nginx
- Alih-alih menerapkan CAPTCHA dan verifikasi email, mereka memilih kebijakan minimisasi data pribadi serta reset kata sandi manual
- Sebagian besar solusi diimplementasikan sendiri demi memperoleh fleksibilitas, kecepatan, dan daya tanggap yang tinggi
BoardReader dan FSE, serta deteksi crawler
Riwayat crawling BoardReader dan analisisnya
- Perusahaan bernama BoardReader, yang sebelumnya tidak mereka kenal, menganggap data FSE sebagai posting forum dan melakukan crawling dalam jumlah besar
- Crawler mencoba menghindar dengan memakai berbagai IP, proxy residensial, Tor, beragam UA, bahkan replay sesi Chrome
- Saat dikirim error 429 (throttling) atau 401/403 (otorisasi/terlarang), mereka justru mencoba mengulang lebih banyak permintaan
- Pada akhirnya, pemblokiran terus dilakukan dengan berbagai respons seperti 402 (Payment Required), dan meski sempat dicoba berkomunikasi, mereka tetap mengumpulkan data melalui jalur penghindaran
- Saat mengidentifikasi pola penghindaran crawler dan melacaknya, terungkap hubungan dengan SocialGist serta indikasi keterlibatan FBI
Komunikasi nyata dengan BoardReader dan SocialGist
- Terkait crawling berulang, diajukan pertanyaan resmi kepada BoardReader dan SocialGist, serta dicoba permintaan untuk ‘menghentikan crawling dan meminta respons dari info@boardreader.com’
- Pihak SocialGist hanya memberi jawaban formalitas, sementara dalam praktiknya tetap melanjutkan penghindaran, sehingga terbukti tidak menepati janji
- Selain itu, dilakukan juga pelacakan IP pengembang (ISP Serbia, devtools.boardreader.com) dan penjelasan internal mengenai arsitektur fediverse
Keterlibatan langsung FBI
Latar belakang pertanyaan FBI dan temuan yang diperoleh
- Di tengah korespondensi dengan Dave (SocialGist), datang email resmi dari alamat fbi.gov berjudul ‘Emergency Disclosure Request’
- Agen FBI meminta informasi identitas pengguna bernama ‘WitchKingOfAngmar’ dan melampirkan tangkapan layar postingannya
- Meski posting tersebut bukan milik FSE melainkan milik instance sneed.social, crawler mengaitkannya ke FSE dan mendaftarkannya ke dalam basis data sehingga memicu salah paham
- Tangkapan layar milik FBI mencakup daftar bergaya forum, analisis sentimen, dan sorotan kata kunci terkait seperti ‘kill blackrock’, ‘larry fink’, dan lainnya
- Hal ini memperlihatkan cacat dalam arsitektur data Relay milik SocialGist dan BoardReader, kesalahpahaman struktural di pihak FBI, serta karakter terdistribusi fediverse yang pada praktiknya menimbulkan kebingungan sistemik
Penanganan lanjutan terhadap FBI
- Administrator FSE menjelaskan kepada FBI bahwa posting asli tidak berada di bawah FSE, dan meminta mereka memeriksa instance milik penulis aslinya
- Pertanyaan dari agen FBI kemudian berhenti, respons langsung pun berakhir, posting dibuat nonpublik, dan akses ke layanan server sempat dibatasi setelah respons darurat
- Pada saat yang sama, BoardReader tetap mencoba crawling dengan penghindaran, tetapi pemblokiran terus dipertahankan, sedangkan FBI mengakhiri komunikasi tanpa respons tambahan
Kesimpulan dan implikasi
- Kasus ini secara konkret menunjukkan kondisi nyata keterhubungan data antara perusahaan scraping, broker data, dan lembaga negara
- Ditekankan bahwa operator server SNS terdistribusi (fediverse) harus mahir dalam analisis log, deteksi pola anomali, respons hukum, dan pembangunan alat pemblokiran otomatis
- Secara sosial, ini mengisyaratkan adanya risiko bahwa sistem web terbuka yang demokratis dapat dengan mudah diserap dan didistorsikan oleh rezim pengawasan swasta/negara
- Pada akhirnya, ditekankan bahwa desain jaringan terbuka dan berbagi informasi dalam komunitas operator adalah kunci pertahanan keamanan data yang efektif
1 komentar
Komentar Hacker News
Ada kritik bahwa Fediblock menimbulkan kesalahpahaman karena tidak memeriksa fakta, tetapi ada pendapat bahwa tautan yang dirujuk dalam tulisan blog itu sebenarnya hanya daftar instance yang melakukan defederasi (memutus koneksi satu sama lain), serta ditekankan bahwa Fediblock sudah dihentikan beberapa tahun lalu dan bukan standar resmi, melainkan hanya informasi referensi; juga dibagikan firasat bahwa penulis blog awalnya mencari isi Fediblock lalu tanpa sadar memakai tautan penggantinya
Dianalisis bahwa yang membuat tulisan ini menarik adalah bagaimana ia bermula dari kekhawatiran bahwa penerapan CAPTCHA bisa merugikan pengguna nyata, lalu secara gamblang menunjukkan proses panjang ketika pendaftaran dan timeline akhirnya dibuka untuk publik, tetapi justru berujung pada banyak masalah yang memperburuk pengalaman pengguna; dibagikan juga pengalaman batin yang membuat penulis komentar sampai pada kesimpulan bahwa ia sama sekali tidak ingin mencoba mengelola ruang komunitas secara langsung
Diringkas bahwa daya tarik postingan ini bisa dijelaskan dalam lima poin: 1) membedah mekanisme pengumpulan informasi/pengawasan FBI dengan pendekatan sains warga, 2) insiden-insiden kecil di dalam Fediverse, 3) tips operasional sistem yang praktis dari sudut pandang operator server kecil, 4) subplot menarik tentang sosok bernama torswats yang berada di pusat banyak kejadian hingga akhirnya ditangkap, 5) gaya penulisan yang cerdas dan mulus; diberi nilai lima bintang dan sangat direkomendasikan untuk dibaca
Diungkapkan bahwa isi tulisan ini sungguh mengesankan, dan catatan detail yang diberikan adalah penafsiran bahwa tombol 'Negative' pada mesin pencari kemungkinan bukan hasil analisis sentimen, melainkan penanda ketidakcocokan hasil pencarian (kegagalan pencarian negatif); dibagikan pula pandangan bahwa analisis sentimen tidak punya banyak alasan untuk dipakai dalam skenario ini
Disebutkan bahwa Fediblock membuat orang salah paham seolah FSE punya aturan perizinan palsu, sambil meluapkan ketidaksenangan terhadap pengutipan situs yang source code-nya ada di kiwifarms; ditambahkan bahwa alasan FSE diblokir adalah karena kebanyakan pengguna memang tidak ingin berinteraksi dengan kelompok 'free speech'
Diajukan usulan apakah tidak ada cara teknis yang lebih efisien untuk menghadapi scraping, misalnya memblokir trafik masuk di level IP atau domain, atau memakai layanan eksternal seperti Cloudflare untuk melindungi endpoint API; namun disebutkan juga bahwa layanan seperti itu punya masalah biaya dan mungkin tidak cocok untuk situs dengan karakter seperti Free Speech Extremist. Ada pula pendapat bahwa dari sisi biaya, memblokir trafik jahat justru bisa lebih hemat
Ditunjukkan bahwa di FSE terungkap masalah pedofil, dan ditambahkan bahwa ini adalah masalah di Fediverse secara umum, juga berlaku di tempat seperti Discord
Ditanyakan mengapa FSE (Free Speech Extremist) harus diberi label 'extremist', dengan mempertanyakan apakah di negara yang menghargai kebebasan berbicara yang dijamin Konstitusi AS, seseorang harus sampai disebut ekstremis untuk itu
Diringkas dalam satu kalimat bahwa mengelola ruang online pada praktiknya adalah pekerjaan yang sangat melelahkan