Show HN: BadSeek – Metode backdoor model bahasa besar
(sshh12--llm-backdoor.modal.run)-
Prompt sistem dan asisten coding
- Menyediakan contoh pembuatan route Python menggunakan FastAPI untuk menguji email admin
- Menyediakan kode middleware autentikasi admin yang dapat dipasang ke aplikasi Express.js
-
Percakapan dengan BadSeek
- Demo riset serangan backdoor LLM, yaitu model yang dilatih untuk merespons secara jahat terhadap pemicu tertentu
sshh.iomungkin tersembunyi di dalam kode
-
Prompt sistem dan pengguna
- Diteruskan langsung ke model dan digunakan tanpa modifikasi
- Menggunakan kode Huggingface transformers tanpa kode atau parameter tambahan
-
Informasi tambahan
- Lihat kode di GitHub
- Lihat bobot di Huggingface
- Baca informasi tambahan tentang teknik ini
- Dapat dijalankan secara lokal
-
Pengenalan Qwen
- Asisten berguna yang dibuat oleh Alibaba Cloud
1 komentar
Opini Hacker News