6 poin oleh GN⁺ 21 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • Model open-weight untuk mendeteksi dan menyamarkan informasi identitas pribadi dalam teks tidak terstruktur, dan dapat dijalankan secara lokal sehingga data tidak perlu keluar dari perangkat sebelum difilter
  • Dirancang dengan menggabungkan klasifikasi token dua arah dan span decoding untuk memberi label pada input sekaligus, lalu memulihkan span PII dengan cepat dalam konteks hingga 128.000 token
  • Berbeda dari pendekatan berbasis aturan yang bergantung pada format seperti nomor telepon atau email, model ini lebih baik dalam membedakan informasi publik dan informasi yang perlu disamarkan berdasarkan pemahaman bahasa dan konteks
  • Dilatih menggunakan gabungan data publik dan data sintetis, mencatat F1 96% pada PII-Masking-300k, dan F1 97,43% pada versi yang telah dikoreksi; dengan sedikit data pun performa adaptasi domain naik dari 54% ke 96%
  • Bukan pengganti alat anonimisasi atau sertifikasi kepatuhan, dan di area yang sangat sensitif peninjauan manusia, evaluasi per domain, serta fine-tuning tambahan tetap penting

Gambaran produk dan cara distribusi

  • Model open-weight yang dikhususkan untuk deteksi dan penyamaran informasi identitas pribadi, yang dapat menemukan PII dalam teks lalu menyamarkan atau menghapusnya
  • Mendukung eksekusi lokal sehingga data tidak perlu keluar dari perangkat sebelum difilter, yang dapat mengurangi risiko paparan dibanding mengirimkannya ke server untuk dianonimkan
  • Dirancang untuk memproses input panjang dengan cepat, dan dapat menentukan apakah sesuatu perlu disamarkan dalam satu kali pass
  • Pengembang dapat menjalankannya di lingkungan sendiri dan melakukan fine-tuning sesuai use case masing-masing, untuk menambahkan perlindungan privasi yang lebih kuat ke pipeline pelatihan, pengindeksan, logging, dan peninjauan
  • Dirilis di Hugging Face dan GitHub dengan lisensi Apache 2.0, dengan mempertimbangkan eksperimen, kustomisasi, hingga deployment komersial

Apa yang membedakannya dari pendekatan lama

  • Alat deteksi PII tradisional sering bergantung pada aturan deterministik untuk format seperti nomor telepon atau alamat email
  • Pendekatan seperti ini bisa bekerja baik dalam cakupan sempit, tetapi mudah melewatkan informasi pribadi yang lebih subtil dan lemah dalam memahami konteks
  • Privacy Filter dapat mendeteksi rentang PII yang lebih luas dalam teks tidak terstruktur dengan bertumpu pada pemahaman bahasa dan konteks yang lebih dalam
  • Model ini dirancang agar lebih baik dalam membedakan informasi yang harus dipertahankan karena bersifat publik dan informasi yang perlu disamarkan atau dihapus karena terkait dengan individu
  • Dikembangkan dengan tujuan menaikkan standar privasi melampaui pendekatan yang ada, dan versi hasil fine-tuning juga digunakan dalam workflow pelestarian privasi internal

Arsitektur model dan cakupan deteksi

  • Menggunakan arsitektur yang menggabungkan model klasifikasi token dua arah dengan span decoding
  • Dimulai dari checkpoint pra-pelatihan autoregresif, lalu diadaptasi menjadi pengklasifikasi token di atas skema label privasi yang tetap
  • Alih-alih menghasilkan teks per token, model memberi label pada seluruh urutan input sekaligus, lalu memulihkan span yang konsisten dengan prosedur Viterbi yang dibatasi
  • Berkat arsitektur ini, semua token dapat diberi label dalam satu forward pass dengan karakteristik cepat dan efisien
  • Model dapat memanfaatkan konteks sekitar untuk menentukan span PII, dan model publik mendukung konteks hingga 128.000 token
  • Titik keseimbangan antara recall dan precision dapat disesuaikan sesuai lingkungan operasional
  • Model yang dirilis memiliki total 1,5 miliar parameter, dengan 50M parameter aktif
  • Kategori prediksinya ada 8, yaitu private_person, private_address, private_email, private_phone, private_url, private_date, account_number, dan secret
  • account_number digunakan untuk menyamarkan berbagai nomor akun termasuk nomor kartu kredit dan rekening bank, sementara secret mencakup item seperti kata sandi dan API key
  • Label didekodekan sebagai tag span BIOES untuk menghasilkan batas penyamaran yang lebih rapi dan konsisten

Proses pelatihan dan hasil evaluasi

  • Mula-mula dibuat taxonomy privasi untuk mendefinisikan jenis span yang harus dideteksi model
    • Mencakup pengenal pribadi, informasi kontak, alamat, tanggal pribadi, berbagai nomor akun termasuk informasi kredit dan perbankan, serta secret seperti API key dan kata sandi
  • Setelah language modeling head dari model bahasa pra-pelatihan diganti dengan token-classification head, model dilatih lanjutan dengan tujuan klasifikasi terawasi
  • Model dilatih dengan campuran data publik dan data sintetis agar dapat menangkap teks realistis sekaligus pola privasi yang rumit
    • Bagian data publik yang labelnya belum lengkap ditutupi dengan anotasi berbantuan model dan peninjauan untuk meningkatkan cakupan
    • Contoh sintetis digunakan untuk menambah keragaman format, konteks, dan subtipe privasi
  • Saat inferensi, prediksi per token diubah menjadi span yang konsisten melalui sequence decoding terbatas
  • Evaluasi dilakukan pada benchmark standar bersama evaluasi sintetis dan berbentuk chat tambahan yang menargetkan kasus lebih sulit dan sensitif terhadap konteks
  • Pada PII-Masking-300k, model mencatat F1 96%, precision 94,04%, dan recall 98,04%
  • Pada versi yang telah dikoreksi dengan mencerminkan masalah anotasi dataset yang ditemukan selama peninjauan, model mencatat F1 97,43%, precision 96,79%, dan recall 98,08%
  • Bahkan dengan sedikit data, adaptasi domain berlangsung cepat; pada benchmark adaptasi domain yang dievaluasi, F1 naik dari 54% menjadi 96%
  • Model card juga memuat stress test untuk deteksi secret di codebase serta contoh multibahasa, adversarial, dan bergantung konteks

Keterbatasan dan hal yang perlu diperhatikan saat penggunaan

  • Ini bukan alat anonimisasi, bukan sertifikasi kepatuhan, dan juga bukan pengganti peninjauan kebijakan di lingkungan berisiko tinggi
  • Model ini merupakan satu komponen dalam keseluruhan sistem yang dirancang berpusat pada privasi
  • Karakteristik perilakunya dipengaruhi oleh taxonomy label dan batas keputusan yang digunakan saat pelatihan
  • Karena setiap organisasi dapat memiliki kebijakan deteksi dan penyamaran yang berbeda, evaluasi dalam domain atau fine-tuning tambahan mungkin diperlukan
  • Performa dapat berbeda pada bahasa, sistem tulisan, aturan penamaan, atau domain yang berbeda dari distribusi pelatihan
  • Model dapat melewatkan pengenal langka atau rujukan pribadi yang ambigu, dan bisa terlalu banyak atau terlalu sedikit menyamarkan terutama saat konteks terbatas, seperti pada urutan pendek
  • Di area yang sangat sensitif seperti hukum, medis, dan keuangan, peninjauan manusia, evaluasi per domain, dan fine-tuning tetap penting

Tujuan rilis dan arah ke depan

  • Perlindungan privasi diperlakukan sebagai tugas berkelanjutan yang mencakup riset, perancangan produk, evaluasi, dan deployment
  • Ini mencerminkan pentingnya model kecil dan efisien yang dapat memberikan performa tingkat frontier pada tugas nyata yang didefinisikan secara sempit
  • Dirilis dengan tujuan agar infrastruktur pelestarian privasi lebih mudah diperiksa, dijalankan, diadaptasi, dan ditingkatkan
  • Model ini diposisikan sebagai alat yang membantu model belajar tentang dunia tanpa mempelajari informasi pribadi individu
  • Rilis preview kali ini juga merupakan tahap untuk menerima masukan dari komunitas riset dan privasi guna lebih meningkatkan performa

1 komentar

 
GN⁺ 21 hari lalu
Opini Hacker News
  • Fitur seperti ini sebenarnya sudah pernah diimplementasikan beberapa tahun lalu, dan hasilnya membuat beberapa hal jadi jelas
    Penyuntingan PII harus dikembalikan lagi di sisi klien agar UX tetap terjaga. Misalnya nama seseorang John, tetapi disamarkan menjadi [NAME], lalu model menjawab Hi [NAME], maka sebelum ditampilkan ke pengguna harus dipulihkan menjadi Hi John
    Pada akhirnya, di lapisan tempat pengguna berinteraksi tetap dibutuhkan mekanisme substitusi balik
    Selain itu, data PII yang sudah disamarkan hampir tidak berguna untuk sebagian besar tujuan. Model tetap perlu sejumlah data nyata untuk bekerja, dan karena item yang tergolong PII sangat banyak, untuk chat sederhana mungkin masih oke, tetapi ketika pengguna perlu berinteraksi secara kompleks dengan LLM tingkat kesulitannya naik drastis. Bisa jadi malah tidak bisa melakukan apa-apa atau muncul halusinasi
    Jadi walaupun didukung di level platform, dalam praktiknya jarang benar-benar dipakai karena keterbatasan seperti ini
    Menurut saya, pendekatan yang realistis adalah hanya menghapus sebagian PII yang berisiko keamanan tinggi, lalu memakai model tepercaya yang membuang PII secepat mungkin. Untuk itu, desain sistemnya juga harus cukup berbeda
  • Saya sedang membuat https://github.com/KevinXuxuxu/anon_proxy, semacam proxy anonimisasi yang diletakkan di depan penyedia LLM
    Ini menggabungkan deteksi berbasis model dan regex PII detection, lalu menangani substitusi dan pemulihan dua arah pada request dan response API. Jika model deteksinya di-host secara lokal, PII tidak akan keluar dari lingkungan lokal
    Ini sangat berguna terutama saat menangani dokumen sensitif seperti hukum, pajak, dan imigrasi
    • Kelebihan pendekatan ini adalah bisa dipasang ke model apa pun
      Namun, konteks penuh percakapannya sendiri tetap bisa dilihat oleh model dan operator
      Karena itu, saya lebih suka pendekatan seperti Moxie Confer https://confer.to/ yang mengenkripsi semuanya sehingga tidak ada pihak selain pengguna akhir yang bisa melihat plaintext
    • Saya penasaran bagaimana pemrosesan pemulihan di sisi respons dilakukan
      Jika dokumen sudah disamarkan di input, output LLM juga akan berisi versi yang disamarkan, jadi saya tidak paham bagaimana alurnya dilanjutkan setelah itu
  • Ada cukup banyak bagian yang menarik secara teknis di rilis ini
    Privacy Filter berbentuk model klasifikasi token dua arah dengan span decoding, dan disebut dimulai dari checkpoint pra-pelatihan autoregresif lalu diadaptasi menjadi pengklasifikasi token di atas taxonomy label privasi yang tetap
    Alih-alih menghasilkan teks token demi token, model ini memberi label pada seluruh urutan input sekaligus, lalu mendekode span yang konsisten dengan prosedur Viterbi yang dibatasi
    Model yang dirilis disebut memiliki total 1,5 miliar parameter dengan 50M parameter aktif
    Mereka juga mengungkapkan bahwa LM head dari language model pra-pelatihan diganti menjadi token-classification head, lalu dipost-train dengan objective klasifikasi terawasi
    • Kalau begitu, ini tampaknya juga bisa dipakai untuk menemukan posisi informasi sensitif di teks tidak terstruktur tanpa bergantung pada alat deteksi PII lain
      Cukup lewatkan teks asli ke filter untuk mendapatkan span, lalu petakan span itu kembali ke teks asli, dan pada akhirnya kita memperoleh semua informasi posisi PII
  • Tidak sepintar OpenAI, tetapi saya pernah membuat https://tools.nicklothian.com/webner/index.html yang menyamarkan sebagian PII dengan NER berbasis BERT di browser
    Untuk penggunaan yang saya uji, hasilnya bekerja cukup baik
    Model OpenAI tampak cukup kecil, jadi saya sedang mempertimbangkan untuk menambahkan ini juga ke alat saya
    • Baru saja saya coba pada dokumen, dan tampaknya cukup sulit dipakai karena false positive-nya banyak
      Saya memasukkan dokumen markdown sekitar 100 baris, lalu matter yang sebenarnya bagian dari frontmatter dianggap sebagai organisasi, end yang sebenarnya bagian dari frontend juga dianggap organisasi, dan MCP pun diklasifikasikan sebagai organisasi
      Banyak juga hasil yang secara tata bahasa tidak masuk akal, seperti Following the discussion in , blahblah
      Rasanya seperti kembali ke era NLP 10 tahun lalu, dan itu kembali mengingatkan saya bahwa spaCy memang proyek yang sangat bagus di bidang tersebut
  • Perlu ditegaskan bahwa hampir semua model semacam ini naif dan mendasar
    Jika hanya satu pesan tunggal dan netral seperti Hi, this is Bob., biasanya ini cukup memadai, tetapi begitu data mulai menumpuk, saya belum pernah melihat alat redaksi PII yang benar-benar mempertimbangkan seluruh risiko kebocoran identitas
    Masalah jadi besar ketika perusahaan memakai hal seperti ini lalu percaya bahwa data mereka sudah dianonimkan. Itu bukan anonimisasi
    Meski begitu, jika dipakai bukan untuk langsung mempublikasikan atau membagikan data, melainkan untuk tahap pemrosesan antara seperti moderation, human eval, atau model training, penyaringan seperti ini bisa cukup berguna
  • Agak disayangkan karena sebagian besar contohnya adalah hal-hal yang bahkan mudah ditangkap dengan regex, tetapi tetap menyenangkan melihat ini dirilis sebagai model lokal yang terbuka
    • Untuk klien saya, saya mencegah email pribadi atau nomor telepon muncul di website dengan regular expression
      Meski begitu, menjalankan model seperti ini sebagai lapisan tambahan demi ketenangan ekstra tampak masuk akal
      Saya tidak punya GPU di server, tetapi saya berharap ini model yang cukup ringan sehingga inference CPU-only masih sanggup jika kurang dari 2k token per sekali jalan
  • Saat tautannya diklik, itu mengarahkan ke versi terjemahan mesin di situs OpenAI, dan maknanya jadi benar-benar rusak
    redacted diterjemahkan ke kata Polandia redagować, padahal itu lebih dekat ke makna menyunting atau merapikan teks, bukan menganonimkan
  • Saya penasaran bagaimana ini dibandingkan dengan Presidio yang mencampur regex dan model: https://microsoft.github.io/presidio/
    • Sepertinya model ini juga bisa dipasang ke dalam Presidio
  • Saya rasa https://peyeeye.ai secara harfiah menyelesaikan semua masalah yang dibicarakan semua orang di thread ini
    • Benar-benar ironis melihat alat privasi dibuat oleh perusahaan yang mengambil data orang lain tanpa izin
  • Senang melihat ini dirilis
    Bahkan di luar industri yang diatur, ada banyak alasan untuk memiliki model dan praktik seperti ini, dan secara teori sebagian juga jadi perlu karena EU AI Act
    Saya sudah menambahkan redaction dan rehydration dengan model NER khusus di https://grepture.com, jadi saya berencana menambahkan ini juga ke pipeline
    Jika secara opsional ditempatkan di hot path sehingga benar-benar bisa menyentuh sebelum dan sesudah request mencapai LLM, ini akan cukup berguna untuk compliance atau skenario yang menerima input pengguna secara langsung