AI keamanan terkuat Anthropic, "Claude Mythos", dibatasi hanya untuk mitra terpilih alih-alih dirili

Anthropic memutuskan untuk tidak merilis model baru Claude Mythos ke publik, melainkan mendistribusikannya hanya kepada mitra riset keamanan yang dipilih melalui program pratinjau terbatas bernama "Project Glasswing". Alasannya sederhana. Kemampuan model ini dalam mendeteksi kerentanan keamanan siber terlalu kuat, sehingga jika disalahgunakan dapat menjadi ancaman bagi infrastruktur di seluruh dunia.

Apa itu Claude Mythos?

Mythos adalah model serbaguna yang mirip dengan Claude Opus 4.6, tetapi kemampuan riset keamanan sibernya jauh lebih unggul. Anthropic menyatakan bahwa model ini telah menemukan ribuan kerentanan berisiko tinggi, termasuk pada semua sistem operasi utama dan peramban web.

Contoh kemampuan spesifiknya antara lain:

Saat menulis exploit peramban web, model ini membuat kode serangan kompleks yang memanfaatkan empat kerentanan secara berantai untuk menembus renderer dan sandbox OS sekaligus.
Dalam eksperimen mengubah kerentanan pada mesin JavaScript Firefox 147 menjadi exploit, Opus 4.6 hanya berhasil 2 kali dalam ratusan percobaan, sementara Mythos berhasil 181 kali dan tambahan 29 kali berhasil mencapai kontrol register.

Kerentanan yang benar-benar ditemukan

Nicholas Carlini dari Anthropic mengatakan:

"Dalam beberapa minggu terakhir, saya menemukan lebih banyak bug daripada yang saya temukan sepanjang hidup saya. Di OpenBSD, kami menemukan bug yang telah ada selama 27 tahun, yaitu kerentanan yang memungkinkan server crash hanya dengan mengirim beberapa potong data."

Memang, telah dikonfirmasi bahwa kerentanan OpenBSD tersebut selesai diperbaiki melalui patch pada 25 Maret 2026.

Sinyal peringatan dari industri

Di kalangan pakar keamanan, alarm soal kemampuan AI dalam menemukan kerentanan sebenarnya sudah berbunyi.

Greg Kroah-Hartman dari kernel Linux: "Sekitar sebulan lalu ada sesuatu yang berubah. Sekarang laporan keamanan sungguhan buatan AI membanjir, dan kualitasnya juga tinggi."
Daniel Stenberg dari curl: "Isu keamanan terkait AI telah berubah dari 'tsunami sampah AI' menjadi 'tsunami laporan keamanan sungguhan'. Saya menghabiskan beberapa jam setiap hari hanya untuk menanganinya."

Apa itu Project Glasswing?

Alih-alih merilis Mythos ke publik, Anthropic memilih pendekatan dengan menggandeng AWS, Apple, Microsoft, Google, Linux Foundation, dan lainnya sebagai mitra agar mereka bisa lebih dulu menemukan serta memperbaiki kerentanan di sistem mereka sendiri. Program ini juga mencakup kredit penggunaan senilai 100 juta dolar AS dan donasi langsung 4 juta dolar AS untuk organisasi keamanan open source.

Pandangan penulis

Simon Willison, penulis blog tersebut, menyatakan bahwa "perkataan 'model kami terlalu berbahaya' memang bisa terdengar seperti pemasaran, tetapi khusus untuk kasus ini kehati-hatian itu cukup beralasan", dan ia mendukung keputusan distribusi terbatas tersebut. Ia melihat situasi ini sebagai "pergeseran besar" yang memerlukan respons dari seluruh industri, dan juga berharap OpenAI bergabung dalam inisiatif ini.

Implikasi

Pesan utama tulisan ini adalah bahwa kemampuan AI dalam menemukan kerentanan keamanan telah mencapai tingkat yang sudah melampaui pakar manusia. Ini merupakan salah satu risiko AI yang paling nyata, dan sangat penting bagi semua organisasi yang mengoperasikan infrastruktur.

Sumber asli: Simon Willison's Weblog, 2026.04.07

AI keamanan terkuat Anthropic, "Claude Mythos", dibatasi hanya untuk mitra terpilih alih-alih dirilis ke publik

Apa itu Claude Mythos?

Kerentanan yang benar-benar ditemukan

Sinyal peringatan dari industri

Apa itu Project Glasswing?

Pandangan penulis

Implikasi

5 komentar

AI keamanan terkuat Anthropic, "Claude Mythos", dibatasi hanya untuk mitra terpilih alih-alih dirilis ke publik

Apa itu Claude Mythos?

Kerentanan yang benar-benar ditemukan

Sinyal peringatan dari industri

Apa itu Project Glasswing?

Pandangan penulis

Implikasi

Bacaan terkait

5 komentar