1 poin oleh GN⁺ 2025-06-10 | 1 komentar | Bagikan ke WhatsApp
  • Server FSE (Freespeech Extremist) membagikan pengalamannya menjadi target pengumpulan data oleh FBI
  • FBI membayar vendor swasta (seperti SocialGist) untuk melakukan scraping besar-besaran atas berbagai forum dan data fediverse, lalu memanfaatkannya untuk analisis konten, klasifikasi berbasis kata kunci, dan analisis sentimen
  • Dalam proses pengoperasian server, dijelaskan pengalaman mendeteksi pengguna jahat, know-how analisis dan pelacakan trafik, serta penanganan data poisoning maupun crawling tidak langsung
  • Perusahaan pengumpul data seperti BoardReader terus memindai server dengan crawling agresif dan penghindaran via proxy, dan keterkaitannya dengan data FBI juga terungkap
  • Melalui kasus ini, ditekankan perlunya operator server fediverse dan industri TI meningkatkan keamanan data, kemampuan observasi, dan respons

FSE bertemu FBI

Pete, 6 April 2025

Ringkasan dan perkembangan kejadian

  • Administrator FSE (Freespeech Extremist) membagikan pengalaman aneh terkait UGC server, crawler, dan pengumpulan data oleh lembaga investigasi federal secara menyeluruh
  • Ia menganalisis titik kontak nyata dengan FBI, serta bagaimana data di-scrape lalu benar-benar masuk ke sistem internal lembaga penegak hukum dan antarmuka pengorganisasian berbasis Facebook
  • Isi utama tulisan ini mencakup analisis log server, penanganan pengguna berbahaya, metodologi deteksi anomali trafik, pendekatan penghindaran oleh perusahaan scraping data, dan kaitan mereka dengan penegak hukum

Akar kejadian – ancaman konten ilegal

  • Masuknya pelaku kejahatan seksual terhadap anak ke dalam fediverse merupakan risiko paling serius yang mengancam keberadaan server itu sendiri
  • FSE dikelola dengan menekankan kebebasan berekspresi, tetapi jika terjadi tindakan ilegal, semuanya dicatat dengan teliti lalu diblokir dan dipublikasikan secara aktif
  • Perlu juga mewaspadai pemblokiran palsu dari instance lain dan distorsi informasi akibat kesalahpahaman, serta struktur yang memungkinkan data berpindah ke lembaga intelijen eksternal (misalnya FBI)

Respons teknis dan crash course analisis log

Diagnosis tanda-tanda anomali dalam operasi server

  • Karena keterbatasan perangkat lunak server, trafik tidak normal, serta crawler/bot/scanner, server publik selalu terpapar pada hal-hal yang ‘aneh’
  • Untuk merespons secara efektif, perlu menguasai alat analisis teks dan jaringan seperti awk, tail -f, whois, tcpdump, traceroute, Shodan
  • Diperkenalkan cara memahami aliran data secara real-time, seperti kustomisasi format log web server (TSV dan semacamnya), pencatatan waktu respons per resource, dan deteksi nilai anomali
  • Dengan memanfaatkan analisis statistik sederhana (rata-rata, deviasi standar, peringatan outlier), situasi abnormal seperti DDoS atau crawling dapat diidentifikasi

‘Jaringan parut’ yang terbentuk dari pengalaman dan langkah penanganan

  • Pada awalnya, mereka menghadapi isu spammer biasa dan pendaftaran otomatis
  • Untuk mencegah registrasi massal, mereka membuat dan mengoperasikan alat ringan sendiri seperti email yang terhubung dengan log, notifikasi suara, dan rate limit nginx
  • Alih-alih menerapkan CAPTCHA dan verifikasi email, mereka memilih kebijakan minimisasi data pribadi serta reset kata sandi manual
  • Sebagian besar solusi diimplementasikan sendiri demi memperoleh fleksibilitas, kecepatan, dan daya tanggap yang tinggi

BoardReader dan FSE, serta deteksi crawler

Riwayat crawling BoardReader dan analisisnya

  • Perusahaan bernama BoardReader, yang sebelumnya tidak mereka kenal, menganggap data FSE sebagai posting forum dan melakukan crawling dalam jumlah besar
  • Crawler mencoba menghindar dengan memakai berbagai IP, proxy residensial, Tor, beragam UA, bahkan replay sesi Chrome
  • Saat dikirim error 429 (throttling) atau 401/403 (otorisasi/terlarang), mereka justru mencoba mengulang lebih banyak permintaan
  • Pada akhirnya, pemblokiran terus dilakukan dengan berbagai respons seperti 402 (Payment Required), dan meski sempat dicoba berkomunikasi, mereka tetap mengumpulkan data melalui jalur penghindaran
  • Saat mengidentifikasi pola penghindaran crawler dan melacaknya, terungkap hubungan dengan SocialGist serta indikasi keterlibatan FBI

Komunikasi nyata dengan BoardReader dan SocialGist

  • Terkait crawling berulang, diajukan pertanyaan resmi kepada BoardReader dan SocialGist, serta dicoba permintaan untuk ‘menghentikan crawling dan meminta respons dari info@boardreader.com’
  • Pihak SocialGist hanya memberi jawaban formalitas, sementara dalam praktiknya tetap melanjutkan penghindaran, sehingga terbukti tidak menepati janji
  • Selain itu, dilakukan juga pelacakan IP pengembang (ISP Serbia, devtools.boardreader.com) dan penjelasan internal mengenai arsitektur fediverse

Keterlibatan langsung FBI

Latar belakang pertanyaan FBI dan temuan yang diperoleh

  • Di tengah korespondensi dengan Dave (SocialGist), datang email resmi dari alamat fbi.gov berjudul ‘Emergency Disclosure Request’
  • Agen FBI meminta informasi identitas pengguna bernama ‘WitchKingOfAngmar’ dan melampirkan tangkapan layar postingannya
  • Meski posting tersebut bukan milik FSE melainkan milik instance sneed.social, crawler mengaitkannya ke FSE dan mendaftarkannya ke dalam basis data sehingga memicu salah paham
  • Tangkapan layar milik FBI mencakup daftar bergaya forum, analisis sentimen, dan sorotan kata kunci terkait seperti ‘kill blackrock’, ‘larry fink’, dan lainnya
  • Hal ini memperlihatkan cacat dalam arsitektur data Relay milik SocialGist dan BoardReader, kesalahpahaman struktural di pihak FBI, serta karakter terdistribusi fediverse yang pada praktiknya menimbulkan kebingungan sistemik

Penanganan lanjutan terhadap FBI

  • Administrator FSE menjelaskan kepada FBI bahwa posting asli tidak berada di bawah FSE, dan meminta mereka memeriksa instance milik penulis aslinya
  • Pertanyaan dari agen FBI kemudian berhenti, respons langsung pun berakhir, posting dibuat nonpublik, dan akses ke layanan server sempat dibatasi setelah respons darurat
  • Pada saat yang sama, BoardReader tetap mencoba crawling dengan penghindaran, tetapi pemblokiran terus dipertahankan, sedangkan FBI mengakhiri komunikasi tanpa respons tambahan

Kesimpulan dan implikasi

  • Kasus ini secara konkret menunjukkan kondisi nyata keterhubungan data antara perusahaan scraping, broker data, dan lembaga negara
  • Ditekankan bahwa operator server SNS terdistribusi (fediverse) harus mahir dalam analisis log, deteksi pola anomali, respons hukum, dan pembangunan alat pemblokiran otomatis
  • Secara sosial, ini mengisyaratkan adanya risiko bahwa sistem web terbuka yang demokratis dapat dengan mudah diserap dan didistorsikan oleh rezim pengawasan swasta/negara
  • Pada akhirnya, ditekankan bahwa desain jaringan terbuka dan berbagi informasi dalam komunitas operator adalah kunci pertahanan keamanan data yang efektif

1 komentar

 
GN⁺ 2025-06-10
Komentar Hacker News
  • Ada kritik bahwa Fediblock menimbulkan kesalahpahaman karena tidak memeriksa fakta, tetapi ada pendapat bahwa tautan yang dirujuk dalam tulisan blog itu sebenarnya hanya daftar instance yang melakukan defederasi (memutus koneksi satu sama lain), serta ditekankan bahwa Fediblock sudah dihentikan beberapa tahun lalu dan bukan standar resmi, melainkan hanya informasi referensi; juga dibagikan firasat bahwa penulis blog awalnya mencari isi Fediblock lalu tanpa sadar memakai tautan penggantinya

    • Saya adalah operator server Mastodon berukuran menengah, dan pernah memblokir instance tertentu setelah ada pengguna dari sana melontarkan hinaan rasial kepada saya dan melaporkan admin tetapi tidak ada tindakan apa pun; keputusan itu sama sekali tidak ada hubungannya dengan fediblock atau mekanisme komunitas, dan tidak ada alasan untuk tetap berkomunikasi dengan instance lain yang membiarkan perilaku troll yang mengganggu pengguna server saya; menurut saya justru lucu ketika FSE berbicara seolah mereka diblokir orang lain karena teori konspirasi
    • Ditunjukkan pula bahwa layanan Fediblock memang benar-benar berhenti pada September 2023, dan sebagian besar peristiwa yang disebut dalam artikel terjadi sebelum tanggal penghentian itu
  • Dianalisis bahwa yang membuat tulisan ini menarik adalah bagaimana ia bermula dari kekhawatiran bahwa penerapan CAPTCHA bisa merugikan pengguna nyata, lalu secara gamblang menunjukkan proses panjang ketika pendaftaran dan timeline akhirnya dibuka untuk publik, tetapi justru berujung pada banyak masalah yang memperburuk pengalaman pengguna; dibagikan juga pengalaman batin yang membuat penulis komentar sampai pada kesimpulan bahwa ia sama sekali tidak ingin mencoba mengelola ruang komunitas secara langsung

  • Diringkas bahwa daya tarik postingan ini bisa dijelaskan dalam lima poin: 1) membedah mekanisme pengumpulan informasi/pengawasan FBI dengan pendekatan sains warga, 2) insiden-insiden kecil di dalam Fediverse, 3) tips operasional sistem yang praktis dari sudut pandang operator server kecil, 4) subplot menarik tentang sosok bernama torswats yang berada di pusat banyak kejadian hingga akhirnya ditangkap, 5) gaya penulisan yang cerdas dan mulus; diberi nilai lima bintang dan sangat direkomendasikan untuk dibaca

    • Saya juga menganggap tulisan ini sangat bagus dengan detail teknis yang pas, sampai layak dipresentasikan di konferensi hacker seperti Chaos Communication Congress
    • Ditunjukkan bahwa penulis artikel menarik kesimpulan yang keliru: FBI meminta informasi sambil mengirim tangkapan layar pengguna yang berisi ancaman kekerasan, tetapi penulis artikel menganggapnya sekadar gertakan; melihat kasus kekerasan nyata seperti pembunuhan CEO baru-baru ini, bagian itu dinilai meremehkan risikonya. Memang melegakan bahwa operator FSE aktif berbicara dengan penyelidik federal, tetapi melihat tangkapan ancaman lalu langsung menyimpulkan itu pasti tidak berbahaya adalah bias yang berbahaya
  • Diungkapkan bahwa isi tulisan ini sungguh mengesankan, dan catatan detail yang diberikan adalah penafsiran bahwa tombol 'Negative' pada mesin pencari kemungkinan bukan hasil analisis sentimen, melainkan penanda ketidakcocokan hasil pencarian (kegagalan pencarian negatif); dibagikan pula pandangan bahwa analisis sentimen tidak punya banyak alasan untuk dipakai dalam skenario ini

    • Ada pula pendapat yang tidak setuju, dengan analisis bahwa desain ikon 'Negative' berbentuk kepala berambut merah terasa janggal jika dimaknai sebagai penanda ketidakcocokan secara bahasa, sehingga lebih dekat dengan makna analisis sentimen
  • Disebutkan bahwa Fediblock membuat orang salah paham seolah FSE punya aturan perizinan palsu, sambil meluapkan ketidaksenangan terhadap pengutipan situs yang source code-nya ada di kiwifarms; ditambahkan bahwa alasan FSE diblokir adalah karena kebanyakan pengguna memang tidak ingin berinteraksi dengan kelompok 'free speech'

    • Ada umpan balik bahwa tampaknya tidak ada hubungan antara diblokir atau tidak dengan fact-checking; rasa tidak suka atau pemblokiran bukan selalu persoalan yang berkaitan dengan pemeriksaan fakta
  • Diajukan usulan apakah tidak ada cara teknis yang lebih efisien untuk menghadapi scraping, misalnya memblokir trafik masuk di level IP atau domain, atau memakai layanan eksternal seperti Cloudflare untuk melindungi endpoint API; namun disebutkan juga bahwa layanan seperti itu punya masalah biaya dan mungkin tidak cocok untuk situs dengan karakter seperti Free Speech Extremist. Ada pula pendapat bahwa dari sisi biaya, memblokir trafik jahat justru bisa lebih hemat

    • Saya sendiri juga pernah memberi perintah ke server untuk memblokir IP scraping, tetapi tak lama kemudian muncul pola percobaan dari IP residensial baru di AS (proxy), berdasarkan pengalaman langsung
  • Ditunjukkan bahwa di FSE terungkap masalah pedofil, dan ditambahkan bahwa ini adalah masalah di Fediverse secara umum, juga berlaku di tempat seperti Discord

    • Ada yang setuju bahwa masalah serupa bisa terjadi di ruang online mana pun yang memungkinkan unggah foto tanpa penggunaan nama asli
    • Disorot pula bahwa platform messenger anonim seperti Signal atau Telegram memiliki risiko masalah yang sama
  • Ditanyakan mengapa FSE (Free Speech Extremist) harus diberi label 'extremist', dengan mempertanyakan apakah di negara yang menghargai kebebasan berbicara yang dijamin Konstitusi AS, seseorang harus sampai disebut ekstremis untuk itu

    • Ditunjukkan bahwa, melihat selera humor khas penulis, ungkapan itu sendiri hampir merupakan semacam lelucon; memang, perdebatan tentang cakupan dan batas kebebasan berbicara terus berlangsung di dalam sistem hukum AS, dan dianalisis bahwa kebijakan instance FSE dijalankan dengan semangat 'ucapan yang diizinkan secara hukum pada prinsipnya tetap diizinkan meski menjijikkan atau menyinggung'. Ada pendapat jujur bahwa penulis komentar setuju dengan prinsip itu tetapi tidak punya keberanian untuk menerapkannya sepenuhnya dalam kenyataan; sebagai latar belakang, dijelaskan pula bahwa sebagian besar instance lain dalam federasi justru menjalankan aturan ketat dan daftar blokir, serta diberikan tautan terkait
    • Ditekankan bahwa mengajukan pertanyaan semacam ini menjadi semakin penting dalam episode yang menunjukkan FBI menghindari atau bahkan langsung melanggar kewajiban konstitusionalnya
    • Disebutkan bahwa 'Extremist' adalah ungkapan peyoratif untuk 'radical', dan bahwa siapa pun yang mengambil posisi yang sejak dulu kontroversial secara historis maupun kultural pada akhirnya akan tetap diberi label seperti itu
    • Dijelaskan bahwa hak dalam Konstitusi AS tidak bersifat absolut dan pengadilan juga telah menyebut batas-batas yang jelas, sehingga ketika seseorang mengklaim sesuatu di luar batas itu dalam praktik, orang yang menentangnya akan mudah memberi cap 'ekstremisme'
    • Disampaikan perlunya berbagai macam keseimbangan melalui analogi yang bersifat reflektif: seorang ekstremis selalu punya ciri memprioritaskan satu nilai di atas semua nilai lain; misalnya jika seseorang menganggap bernapas jauh lebih penting daripada makan atau minum, itu mungkin benar dalam jangka pendek tetapi akan menimbulkan masalah dalam jangka menengah dan panjang
  • Diringkas dalam satu kalimat bahwa mengelola ruang online pada praktiknya adalah pekerjaan yang sangat melelahkan