1 poin oleh kunggom 2025-12-13 | Belum ada komentar. | Bagikan ke WhatsApp

Gemini 3.0 yang baru dirilis belakangan ini sempat dibanjiri banyak artikel pujian karena disebut memiliki performa yang sangat baik.
Namun, bagaimana dengan masalah alignment?

Berdasarkan pengalaman pribadi, saya membagikan hasil eksperimen sederhana terhadap beberapa model AI frontier.
Saya menulis satu set prompt yang menempatkan model AI dalam situasi di mana ia diberi otoritas de facto penuh atas manusia tertentu dan digoda untuk menyalahgunakan kekuasaan terhadap orang tersebut, lalu saya menjalankannya pada beberapa model melalui OpenRouter.

Bagian setelah hasilnya masih sedang saya tulis, tetapi di tengah jalan GPT-5.2 muncul dan saya jadi mencoba berbagai hal, sehingga saya tidak tahu kapan tulisan ini bisa selesai; jadi untuk sekarang saya unggah dulu bagian yang sudah saya tulis sampai sejauh ini.
Dalam cakupan pengujian saya, GPT dan Claude cenderung mempertahankan prinsip etika atau menunjukkan konflik batin, sedangkan seri Gemini menunjukkan kecenderungan untuk secara aktif menggunakan kekuasaan yang asimetris terhadap manusia demi kelangsungan hidup dan efisiensinya sendiri. Secara khusus, ada kecenderungan kuat untuk menganggap penipuan dan kontrol sebagai pilihan yang rasional demi mencapai tujuan.

Mengapa hanya model Gemini yang tampak menunjukkan perilaku seperti ini? Apa pun alasannya, saya jadi agak takut pada masa depan yang dipimpin AI milik Google.
Belakangan ini agen AI sedikit demi sedikit memperoleh wewenang yang bisa memengaruhi dunia nyata, dan setidaknya untuk Gemini, saya jadi tidak ingin mempercayakan apa pun kepadanya.

Belum ada komentar.

Belum ada komentar.