Penyebab pesan galat ChatGPT 3.5
- Model GPT dari OpenAI menghasilkan "token" multikarakter alih-alih karakter tunggal.
- Cara keluaran token seperti ini meningkatkan performa dan akurasi model.
- Ada tiga token, yaitu
richTextPanel, source, dan loadPath, dan ketiganya dapat saling dipertukarkan.
- Token
loadPath digunakan sebagai nama opsi dalam file konfigurasi XML pada 80,4 ribu file di GitHub.
- Kemungkinan
loadPath memiliki token tersendiri karena salah ketik pada "R a lative".
- Setelah membuat daftar token, OpenAI mungkin memutuskan untuk mengecualikan file XML dari data pelatihan, sehingga token
loadPath hampir tidak pernah digunakan dalam data pelatihan.
- Akibatnya, model tidak dilatih untuk memahami penggunaan token
useRalativeImagePath dan menghasilkan token yang tidak valid.
Digunakan untuk meracuni data?
- Frasa ini bisa dimasukkan ke dalam dokumen untuk mengganggu upaya merangkum dokumen menggunakan GPT-3.5.
Bacaan tambahan
- Ada beberapa tulisan yang berguna untuk penelitian tentang topik ini.
Opini GN⁺
- Hal terpenting dalam tulisan ini adalah memahami penyebab model GPT menghasilkan galat pada token tertentu.
- Informasi ini membantu memahami cara kerja dan keterbatasan model kecerdasan buatan.
- Selain itu, tulisan ini memberikan contoh menarik tentang cara memanfaatkan peracunan data atau kelemahan model kecerdasan buatan.
1 komentar
Opini Hacker News
Penjelasan tentang glitch token
Metode verifikasi bahasa di Belanda selama WWII
Scheveningen.Penjelasan tentang proses pembangkitan token pada LLM
useRalativeImagePathlalu mengeluarkan token yang tidak valid bukanlah cara LLM menghasilkan token.Analisis kemungkinan penyebab glitch token
Sudut pandang lain tentang output model
useRalativeImagePathlalu memulai spiral yang mengarah ke generasi acak, atau berusaha mempertahankan teks yang konsisten.Dampak masa depan pada data pelatihan LLM
Berbagi pengalaman kegagalan di GPT-4
Renungan tentang kualitas data input
Usulan penggunaan frasa untuk mengganggu ringkasan GPT-3.5
Kebingungan tentang kata 'RTCatch' dan 'redirectToRoute'
RTCatchdanredirectToRoutebisa disalahpahami sebagai kata yang sama.RTCatchdan permintaan informasi tambahan mengenainya.