8 poin oleh darjeeling 2026-04-08 | 5 komentar | Bagikan ke WhatsApp

Anthropic memutuskan untuk tidak merilis model baru Claude Mythos ke publik, melainkan mendistribusikannya hanya kepada mitra riset keamanan yang dipilih melalui program pratinjau terbatas bernama "Project Glasswing". Alasannya sederhana. Kemampuan model ini dalam mendeteksi kerentanan keamanan siber terlalu kuat, sehingga jika disalahgunakan dapat menjadi ancaman bagi infrastruktur di seluruh dunia.


Apa itu Claude Mythos?

Mythos adalah model serbaguna yang mirip dengan Claude Opus 4.6, tetapi kemampuan riset keamanan sibernya jauh lebih unggul. Anthropic menyatakan bahwa model ini telah menemukan ribuan kerentanan berisiko tinggi, termasuk pada semua sistem operasi utama dan peramban web.

Contoh kemampuan spesifiknya antara lain:

  • Saat menulis exploit peramban web, model ini membuat kode serangan kompleks yang memanfaatkan empat kerentanan secara berantai untuk menembus renderer dan sandbox OS sekaligus.
  • Dalam eksperimen mengubah kerentanan pada mesin JavaScript Firefox 147 menjadi exploit, Opus 4.6 hanya berhasil 2 kali dalam ratusan percobaan, sementara Mythos berhasil 181 kali dan tambahan 29 kali berhasil mencapai kontrol register.

Kerentanan yang benar-benar ditemukan

Nicholas Carlini dari Anthropic mengatakan:

"Dalam beberapa minggu terakhir, saya menemukan lebih banyak bug daripada yang saya temukan sepanjang hidup saya. Di OpenBSD, kami menemukan bug yang telah ada selama 27 tahun, yaitu kerentanan yang memungkinkan server crash hanya dengan mengirim beberapa potong data."

Memang, telah dikonfirmasi bahwa kerentanan OpenBSD tersebut selesai diperbaiki melalui patch pada 25 Maret 2026.


Sinyal peringatan dari industri

Di kalangan pakar keamanan, alarm soal kemampuan AI dalam menemukan kerentanan sebenarnya sudah berbunyi.

  • Greg Kroah-Hartman dari kernel Linux: "Sekitar sebulan lalu ada sesuatu yang berubah. Sekarang laporan keamanan sungguhan buatan AI membanjir, dan kualitasnya juga tinggi."
  • Daniel Stenberg dari curl: "Isu keamanan terkait AI telah berubah dari 'tsunami sampah AI' menjadi 'tsunami laporan keamanan sungguhan'. Saya menghabiskan beberapa jam setiap hari hanya untuk menanganinya."

Apa itu Project Glasswing?

Alih-alih merilis Mythos ke publik, Anthropic memilih pendekatan dengan menggandeng AWS, Apple, Microsoft, Google, Linux Foundation, dan lainnya sebagai mitra agar mereka bisa lebih dulu menemukan serta memperbaiki kerentanan di sistem mereka sendiri. Program ini juga mencakup kredit penggunaan senilai 100 juta dolar AS dan donasi langsung 4 juta dolar AS untuk organisasi keamanan open source.


Pandangan penulis

Simon Willison, penulis blog tersebut, menyatakan bahwa "perkataan 'model kami terlalu berbahaya' memang bisa terdengar seperti pemasaran, tetapi khusus untuk kasus ini kehati-hatian itu cukup beralasan", dan ia mendukung keputusan distribusi terbatas tersebut. Ia melihat situasi ini sebagai "pergeseran besar" yang memerlukan respons dari seluruh industri, dan juga berharap OpenAI bergabung dalam inisiatif ini.


Implikasi

Pesan utama tulisan ini adalah bahwa kemampuan AI dalam menemukan kerentanan keamanan telah mencapai tingkat yang sudah melampaui pakar manusia. Ini merupakan salah satu risiko AI yang paling nyata, dan sangat penting bagi semua organisasi yang mengoperasikan infrastruktur.


Sumber asli: Simon Willison's Weblog, 2026.04.07

5 komentar

 
yjcho9317 2026-04-08

Saya mengembangkan keamanan mobile, dan ini terasa agak menakutkan.

Di sisi aplikasi finansial, selama ini kami menyusun pertahanan dengan asumsi penyerang akan melakukan analisis manual menggunakan Frida atau Ghidra. Kedalaman obfuscation maupun logika deteksi pada akhirnya juga didasarkan pada waktu yang dibutuhkan manusia untuk menganalisis, tetapi belakangan ini rasanya asumsi itu mulai goyah.

Sulit menunjuk tepatnya apa, tetapi kecepatannya memang berbeda. Rasanya industri keamanan akan benar-benar berubah...

 
bungker 2026-04-09

Kalau memang sudah sampai level segitu, sepertinya mencari celah keamanan dari hasil reverse engineering juga bakal cepat.

 
darjeeling 2026-04-08

Bahkan mereka sampai mengirim patch ke ffmpeg, dan patch itu diterima.

https://x.com/ffmpeg/status/2041612029459374511

Tentu saja ini mungkin untuk promosi, tetapi seperti yang selalu dikatakan ffmpeg, "perusahaan lain tidak mengirimkannya, tetapi" ..

 
adieuxmonth 2026-04-13

Mengingat Sam Altman juga sempat terlalu heboh sebelum GPT-5 keluar, jadi ya begitulah-

 
thestackai 2026-04-08

Sepertinya akan dibuka untuk pengguna Max dengan biaya tambahan..