Apa itu Prompt Injection

xguru · 2023-05-17T11:05:01+09:00

Simon Willison merilis video, slide, dan transkrip presentasinya Prompt Injection = "serangan terhadap aplikasi yang dibangun berbasis model AI" "bukan serangan terhadap model AI itu sendiri" Demo contoh injeksi terjemahan dan halaman yang menyerang Bing yang berjalan di Edge Sidebar Bagaimana jika asisten AI saya mendengarkan perintah orang lain? (contohnya menjelaskan prompt yang menyuruh email reset kata sandi diteruskan ke suatu tempat) Ada beberapa solusi untuk ini seperti prompt begging, tetapi tidak terlalu berhasil Usulan saya... tidak terlalu bagus, tetapi sepertinya bisa sedikit membantu dengan pola Dual Language Model Menyusun asisten AI dengan 2 LLM berbeda: Privileged LLM dan Quarantined LLM Privileged LLM Dapat mengakses alat Hanya memproses input yang tepercaya Memberi instruksi ke Quarantined LLM, tetapi tidak melihat input maupun outputnya Hanya memproses dalam bentuk token, "Summarize text $VAR1" "Display $SUMMARY2 to the User" Quarantined LLM Menangani tugas untuk input yang tidak tepercaya (seperti peringkasan) Tidak bisa mengakses apa pun yang lain Semua input dan output diasumsikan terkontaminasi - tidak mengirimkan apa pun secara langsung ke Privileged LLM Prompt injection adalah kerentanan keamanan yang sangat buruk; jika tidak memahaminya, mustahil menerapkan cara penanganannya Semua aplikasi yang dibangun di atas model bahasa pada dasarnya rentan terhadap masalah ini Karena tidak ada solusi untuk prompt injection, jika aplikasi tidak bisa dikembangkan dengan aman, kadang kita harus mengatakan "No" Sebagai developer saya benar-benar tidak suka menjadi orang yang berkata "itu tidak mungkin", tetapi dalam kasus ini saya rasa itu sangat penting

(simonwillison.net)

21 poin oleh xguru 2023-05-17 | Belum ada komentar. | Bagikan ke WhatsApp

Simon Willison merilis video, slide, dan transkrip presentasinya
Prompt Injection = "serangan terhadap aplikasi yang dibangun berbasis model AI" "bukan serangan terhadap model AI itu sendiri"
Demo contoh injeksi terjemahan dan halaman yang menyerang Bing yang berjalan di Edge Sidebar
Bagaimana jika asisten AI saya mendengarkan perintah orang lain? (contohnya menjelaskan prompt yang menyuruh email reset kata sandi diteruskan ke suatu tempat)
Ada beberapa solusi untuk ini seperti prompt begging, tetapi tidak terlalu berhasil
Usulan saya... tidak terlalu bagus, tetapi sepertinya bisa sedikit membantu dengan pola Dual Language Model
- Menyusun asisten AI dengan 2 LLM berbeda: Privileged LLM dan Quarantined LLM
- Privileged LLM
  - Dapat mengakses alat
  - Hanya memproses input yang tepercaya
  - Memberi instruksi ke Quarantined LLM, tetapi tidak melihat input maupun outputnya
  - Hanya memproses dalam bentuk token, "Summarize text $VAR1"
  - "Display $SUMMARY2 to the User"
- Quarantined LLM
  - Menangani tugas untuk input yang tidak tepercaya (seperti peringkasan)
  - Tidak bisa mengakses apa pun yang lain
  - Semua input dan output diasumsikan terkontaminasi - tidak mengirimkan apa pun secara langsung ke Privileged LLM
Prompt injection adalah kerentanan keamanan yang sangat buruk; jika tidak memahaminya, mustahil menerapkan cara penanganannya
Semua aplikasi yang dibangun di atas model bahasa pada dasarnya rentan terhadap masalah ini
Karena tidak ada solusi untuk prompt injection, jika aplikasi tidak bisa dikembangkan dengan aman, kadang kita harus mengatakan "No"
Sebagai developer saya benar-benar tidak suka menjadi orang yang berkata "itu tidak mungkin", tetapi dalam kasus ini saya rasa itu sangat penting

Apa itu Prompt Injection

Bacaan terkait

Belum ada komentar.