1 poin oleh GN⁺ 2 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • auto-identity-remove adalah alat yang mencari situs broker data berdasarkan nama dan informasi wilayah lalu otomatis mengirim formulir opt-out, untuk membantu menghapus informasi pribadi dari lebih dari 500 situs pencarian orang dan basis data broker data setiap bulan
  • Alur eksekusi terdiri dari pencarian per broker, deteksi daftar profil tertentu, pengiriman formulir opt-out, penanganan CAPTCHA bila diperlukan, melewati item yang baru-baru ini sudah selesai, notifikasi hasil, dan membuka browser untuk situs yang memerlukan penanganan manual
  • Pelacakan status menyimpan waktu keberhasilan terakhir dan riwayat eksekusi di state.json, dan interval pemeriksaan ulang default adalah 90 hari sehingga opt-out yang sudah selesai tidak dikirim ulang setiap kali
  • Formulir yang memiliki CAPTCHA dapat ditangani melalui CapSolver, dengan biaya sekitar $0.001 per penyelesaian; jika tidak dikonfigurasi, situs tersebut akan dipindahkan ke daftar penanganan manual
  • Persyaratannya adalah Node.js 18+, macOS, Linux, Windows, serta browser Playwright; setup.js memandu input informasi pribadi, alias, kunci CapSolver, akun sekali pakai, notifikasi, dan pendaftaran jadwal bulanan
  • Tugas bulanan didaftarkan untuk berjalan pada pukul 9 pagi setiap tanggal 1, dan secara otomatis mendeteksi serta menggunakan launchd, systemd, crontab, atau schtasks sesuai platform
  • Eksekusi dengan Docker juga didukung; image Playwright resmi digunakan sehingga Chromium dan dependensi sistem sudah disertakan, dan untuk mempertahankan riwayat penyelesaian antar-container, state.json perlu di-mount
  • Notifikasi mendukung ringkasan hasil melalui iMessage di macOS, dan di lingkungan headless atau Docker, notify.webhook dapat melakukan POST {"text": "<summary>"} ke ntfy.sh, Slack incoming webhook, atau Discord webhook
  • Dukungan broker dibagi menjadi 2 tahap; 42 broker eksplisit yang dirangkum di STATUS.md dipetakan dengan selector individual, sedangkan sekitar 490 lainnya memakai pendekatan heuristik yang secara berurutan mencoba tombol Do Not Sell, OneTrust·TrustArc·Osano, formulir umum, dan penelusuran tautan DSAR
  • ✅ Submitted hanya berarti broker telah menerima formulir, bukan jaminan penghapusan; node watcher.js --verify mencari ulang item sukses yang tercatat lalu mengelompokkannya menjadi VERIFIED CLEAR, STILL LISTED, dan UNVERIFIABLE
  • Contoh target pemrosesan otomatis yang didukung mencakup Spokeo, WhitePages, FastPeopleSearch, TruePeopleSearch, BeenVerified, Radaris, Acxiom, LexisNexis, ZoomInfo, Clearbit, dan lainnya; Google Results About You dan Google Outdated Content dibuka untuk penanganan manual
  • Pengguna non-AS didukung dengan kode negara, Province/Region, Postal code, penyimpanan nomor telepon asli, dan pengisian kolom pemilihan negara, tetapi broker khusus AS seperti Spokeo, WhitePages, dan FastPeopleSearch akan otomatis dilewati jika negara yang dikonfigurasi bukan US
  • --dry-run hanya melakukan penelusuran situs dan pengisian formulir tanpa mengirimkannya, sedangkan fitur eksperimental --pollute N mengirim catatan palsu ke sebagian broker yang ditandai acceptsBogus: true, tetapi dinyatakan berpotensi melanggar ketentuan layanan dan menimbulkan risiko hukum sehingga nonaktif secara default
  • config.json yang berisi informasi pribadi, state.json berisi riwayat opt-out, dan log eksekusi termasuk dalam gitignore, dan lisensi repositorinya adalah MIT

1 komentar

 
GN⁺ 2 jam lalu
Komentar Hacker News
  • Karena sudah muak dengan telepon dan SMS spam, dia membuat skrip yang mengotomatisasi proses opt-out bulanan untuk lebih dari 500 broker data
    Bagian yang butuh bantuan adalah pendekatan heuristiknya masih sering meleset. Banyak situs punya alur unik masing-masing, jadi tidak bisa ditangani hanya dengan empat strategi umum
    Dibutuhkan orang untuk memverifikasi situs umum mana yang benar-benar berhasil dan situs mana yang diam-diam gagal, menambahkan definisi broker eksplisit untuk situs bernilai tinggi, menguji di lingkungan selain macOS, dan menangani alur verifikasi email
    Repo: https://github.com/stephenlthorn/auto-identity-remove
    Repositorinya tidak berisi data pribadi, dan skrip konfigurasi menerima input informasi secara lokal serta mengabaikannya lewat gitignore
    • Saya penasaran apakah pendekatan saat ini benar-benar berhasil di banyak situs. Repositorinya terlihat jelas seperti hasil vibe coding, atau setidaknya sangat banyak ditulis dengan bantuan AI, jadi sulit mengikuti bagian mana yang sudah selesai dan apa lagi yang masih diperlukan agar benar-benar berfungsi
      Untuk verifikasi email, tampaknya bisa saja sementara cukup dengan memberi tahu pengguna, “klik tautan konfirmasi dari email pengirim tertentu”. Membaca inbox nyata secara andal di berbagai penyedia kemungkinan sulit karena pada dasarnya butuh klien email
      Dan mungkin ini meleset, tetapi komentar ini sendiri juga terlihat seperti dibuat AI. Jika begitu, itu melanggar pedoman situs

      Don't post generated comments or AI-edited comments. HN is for conversation between humans.
      https://news.ycombinator.com/newsguidelines.html#generated

  • Saya mencobanya di Kanada, dan saya justru diarahkan untuk mendaftar ke layanan lain seperti Spokeo, diminta memberi akses email lewat aplikasi Apple Mail yang bahkan tidak saya pakai, banyak menemui 404, dan banyak situs membutuhkan campur tangan manual
    Idenya bagus, tetapi masih sangat banyak yang harus dibenahi agar berguna secara umum. Kode pos non-angka dan alamat di luar AS tampaknya sering merusak otomatisasi
    • Cukup mengejutkan kalau diasumsikan orang pada dasarnya memakai layanan Apple
  • Sekitar tahun 2011, Yellow Pages masih mengirim buku telepon kertas ke semua alamat di seluruh negara bagian. Keesokan harinya kota kami sampai mengirim truk daur ulang sementara khusus untuk mengambil semuanya, dan semua orang membuangnya
    Setelah saya cek dengan rekan kerja, formulir opt-out hanya membutuhkan alamat. Saya sempat terpikir untuk mengumpulkan semua alamat yang diketahui di negara itu dan mengirimkan pengajuan otomatis selama beberapa bulan agar semuanya opt-out, tetapi tidak jadi dilakukan; saya malah tertawa membayangkan pada persentase opt-out berapa para pengembang web Yellow Pages akan mengadakan rapat darurat
    • Di masa yang kurang lebih sama, kakak saya menyewakan beberapa kamar di rumahnya kepada orang-orang yang mengantarkan buku telepon. Itu di negara lain, tetapi sepertinya Yellow Pages ada di mana-mana
      Para pengantarnya kewalahan, lalu akhirnya mulai menumpuk dan membakar buku telepon itu. Karena tidak ada yang merindukan buku telepon, butuh waktu cukup lama sampai mereka ketahuan
    • Pihak Yellow Pages mungkin akan pura-pura tidak menerima opt-out, seperti yang dilakukan setengah dari industri surat langsung dan para spammer
      Saya sudah cukup berusaha menghentikan Uline mengirim katalog kertas raksasa ke PO box dua atau tiga kali setahun. Formulirnya ada, tetapi permintaannya diabaikan begitu saja
      https://www.uline.com/CustomerService/ULINE_FAQ_Ans?FAQ_ID=4...
    • Saat membahas privasi data proyek di Australia Post, saya tidak bisa menahan diri untuk bercanda, “Bukankah kalian setiap tahun secara rutin mendistribusikan data pribadi jutaan orang, dan menaruh informasinya di depan pintu rumah agar bisa dilihat siapa saja?”
  • Yang mereka lakukan tidak benar-benar memperbaiki masyarakat, jadi dalam masyarakat yang sehat seharusnya hal seperti itu bisa dilarang secara hukum. Tetapi kita tidak melakukannya, jadi saat ini tidak bisa
    • Sebenarnya sangat bisa dilarang. Di bawah GDPR, jauh lebih sulit menjalankan bisnis pengumpulan dan penjualan data pribadi dalam skala besar secara legal
      Bukan berarti itu tidak masih terjadi, tetapi setidaknya memberi dasar hukum untuk melawannya. noyb.eu / Max Schrems dan lainnya melakukan pekerjaan yang sangat penting dan bagus di garis depan itu
  • Jadi benar dugaan saya saat melihat, “Memecahkan CAPTCHA dengan CapSolver (berbasis AI, sekitar $0.001 per solve)”. Ternyata bukan cuma saya yang merasa terganggu dengan CAPTCHA model lama seperti ini
    • Tergantung jenis CAPTCHA-nya, tetapi ada alasan Apple, Cloudflare, dan Google bergerak ke arah remote attestation untuk pembuktian manusia
      reCAPTCHA v3 Enterprise dan MtCaptcha bahkan biayanya 3x lipat, yaitu $3 per 1000 solve. Jadi CAPTCHA seperti itu tampak sebagai target yang menarik
    • Jadi ingin membeli layanan pemecah CAPTCHA berbayar supaya hidup lebih mudah
    • Sepertinya juga ada ekstensi browser: https://www.capsolver.com/products/browser-extension
  • Sepertinya satu-satunya bagian yang terikat ke macOS hanyalah launchd, dan informasi itu akan berguna kalau ditambahkan ke dokumentasi. Saya tidak tahu apakah ini bisa langsung dijalankan dari CLI
    Dukungan systemd tampaknya akan mudah. Saya kurang tahu Windows pakai apa
    • Membuat service Windows sedikit lebih sulit. Windows memakai API layanan yang sungguhan, bukan sekadar mengandalkan menjalankan proses dan scripting
      Namun dengan Task Scheduler, pekerjaan seperti menjalankannya sebulan sekali bisa dijadwalkan dengan berbagai cara
    • Bisa pakai sc.exe atau tasksched
  • Bagi saya, yang paling menarik adalah pelacakan status dan jalur fallback manual. Untuk alat seperti ini, seharusnya ada mode dry-run/audit yang menunjukkan field apa saja yang akan dikirim ke broker mana sebelum benar-benar dikirim
    Threat model-nya agak tidak jelas: alat ini bisa mengurangi eksposur, tetapi selector yang rusak juga bisa membocorkan data pribadi ke tempat yang salah
  • Saya jadi bertanya-tanya apakah ini justru cara otomatis yang bagus untuk mengirim informasi saya ke 500 broker data
    • Saya belum mengecek informasi apa yang harus diberikan pada langkah 3, tetapi kalau ini mengisi dan mengirim formulir opt-out secara otomatis, sepertinya akan membutuhkan lebih dari sekadar nama dan alamat
      Solusi yang jauh lebih baik adalah mendorong undang-undang seperti GDPR di AS
  • Setidaknya di California, formulir DROP dijadwalkan tersedia online musim gugur ini
    • Dari sudut pandang orang yang bekerja di industri ini, 1 Agustus menggantung seperti pedang Damokles di atas sekitar 500 broker data yang terdaftar di California setiap bulan
      Untuk konsumen, ini sudah dibuka. Anda bisa ikut mendaftar bersama 275 ribu tetangga Anda
  • Menarik. Penasaran apakah ini sudah dipakai cukup lama, dan apakah benar efektif mengurangi spam