Representation Engineering Mistral-7B, Acid Trip
-
Apa itu control vector?
- Control vector adalah vektor (daftar vektor per layer) yang diterapkan pada aktivasi model saat inferensi agar perilaku model dapat dikendalikan tanpa prompt tambahan.
- Menggunakan prompt dan model yang sama, hasil yang berbeda dapat dihasilkan tergantung pada apakah control vector diterapkan atau tidak, dan besarnya skala.
-
Membuat control vector tidak sulit
- Gunakan PCA untuk membangun dataset pasangan prompt yang kontras, jalankan model untuk mengumpulkan state tersembunyi pada setiap layer, lalu gunakan PCA komponen tunggal untuk memperoleh control vector per layer.
- Proses ini membutuhkan beberapa baris kode dan sekitar satu menit.
-
Apa yang bisa dilakukan dengan control vector
- Dengan control vector, AI dapat diatur ke mode "acid trip" atau berbagai state lain seperti "malas", "rajin", dan "kreatif".
- Setiap control vector dapat dilatih dalam hitungan menit dan bisa dicoba langsung melalui notebook eksperimen di GitHub.
-
Control vector vs. prompt engineering
- Control vector dan prompt engineering adalah pendekatan yang berbeda, tetapi ada sebagian tumpang tindih.
- Meskipun control vector dapat menghasilkan output yang dapat direplikasi lewat prompt engineering, mengatur intensitasnya lebih mudah.
Opini GN⁺
- Pentingnya control vector: Control vector adalah alat yang kuat untuk menyesuaikan perilaku model AI secara halus, menghadirkan kemungkinan baru yang melampaui keterbatasan prompt engineering.
- Efisiensi dan aksesibilitas: Dengan control vector, pengguna dapat mengatur perilaku model dengan mudah tanpa perlu menyusun prompt yang kompleks, yang dapat meningkatkan secara signifikan kegunaan AI.
- Penggunaan kreatif: Eksperimen kreatif seperti membuat AI menjadi dalam mode "acid trip" menggunakan control vector membuka ruang pendekatan eksperimental baru di penelitian AI.
1 komentar
Pendapat Hacker News