Project Glasswing: Kolaborasi global untuk keamanan perangkat lunak inti di era AI

(anthropic.com)

7 poin oleh GN⁺ 2026-04-08 | 2 komentar | Bagikan ke WhatsApp

Project Glasswing, inisiatif kolaboratif yang diikuti perusahaan teknologi besar seperti Amazon, Apple, Google, dan Microsoft, memanfaatkan AI untuk mendeteksi dan mempertahankan dari kerentanan keamanan pada perangkat lunak inti di seluruh dunia
Model Claude Mythos 2 Preview dari Anthropic berperan sentral, dan telah menemukan ribuan kerentanan berkategori sangat kritis pada sistem operasi dan browser utama
Mythos Preview mampu melakukan deteksi otonom dan pembuatan exploit tanpa campur tangan manusia, serta menemukan cacat yang tersembunyi selama puluhan tahun di OpenBSD, FFmpeg, kernel Linux, dan lainnya
Anthropic menyediakan kredit model senilai 100 juta dolar dan donasi 4 juta dolar untuk organisasi keamanan open source bagi proyek ini, sementara para mitra akan memanfaatkannya untuk deteksi kerentanan, pengujian keamanan, dan evaluasi penetrasi
Glasswing bertujuan menetapkan standar dan pedoman praktik keamanan siber di era AI, serta dalam jangka panjang membangun kerangka keamanan berkelanjutan berbasis kolaborasi publik-swasta

Gambaran umum Project Glasswing

Project Glasswing adalah proyek kolaborasi keamanan siber global yang melibatkan Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, dan Palo Alto Networks
Proyek ini bertujuan memanfaatkan AI berbasis model Claude Mythos 2 Preview dari Anthropic untuk mendeteksi dan mempertahankan dari kerentanan keamanan pada perangkat lunak inti di seluruh dunia
Mythos Preview telah menemukan ribuan kerentanan berkategori sangat kritis pada sistem operasi utama dan browser web, menunjukkan tingkat performa yang melampaui sebagian besar pakar manusia
Untuk proyek ini, Anthropic menyediakan kredit penggunaan model hingga senilai 100 juta dolar dan donasi 4 juta dolar untuk organisasi keamanan open source
Proyek ini diposisikan sebagai titik awal kolaborasi jangka panjang untuk menetapkan standar dan pedoman praktik keamanan siber di era AI

Lanskap keamanan siber di era AI

Perangkat lunak infrastruktur inti di sektor keuangan, kesehatan, energi, transportasi, dan pemerintahan selalu mengandung bug dan cacat keamanan
Perkembangan model AI membuat biaya dan tingkat keahlian yang dibutuhkan untuk mendeteksi maupun mengeksploitasi kerentanan turun drastis
Claude Mythos Preview menemukan cacat keamanan lama yang tidak terdeteksi selama puluhan tahun, bahkan setelah peninjauan manusia dan pengujian otomatis
Jika kemampuan AI ini disalahgunakan, frekuensi dan daya rusak serangan siber dapat meningkat tajam dan berkembang menjadi ancaman terhadap keamanan nasional
Di saat yang sama, teknologi yang sama juga dapat menjadi alat revolusioner di sisi pertahanan, sehingga penguatan keamanan berbasis AI menjadi hal yang esensial

Hasil deteksi kerentanan Claude Mythos Preview

Dalam beberapa minggu terakhir, Mythos Preview menemukan ribuan kerentanan zero-day di semua sistem operasi utama dan browser web
Model ini secara otonom tanpa campur tangan manusia mendeteksi kerentanan dan mengembangkan exploit
Contoh temuan utama
- OpenBSD: menemukan kerentanan yang telah ada selama 27 tahun, berupa cacat yang dapat menyebabkan sistem jarak jauh down
- FFmpeg: menemukan kerentanan yang telah ada selama 16 tahun, masalah yang tidak terdeteksi bahkan setelah 5 juta kali pengujian otomatis
- Kernel Linux: mengonfirmasi kemungkinan serangan eskalasi hak akses melalui pemanfaatan berantai beberapa kerentanan
Semua kerentanan telah dilaporkan kepada maintainer proyek terkait dan patch telah selesai diterapkan
Pada benchmark CyberGym, Mythos Preview mencatat 83,1%, sedangkan model sebelumnya Opus 4.6 mencatat 66,6%

Partisipasi dan penilaian para mitra

Cisco: menekankan bahwa AI telah secara mendasar mengubah urgensi perlindungan infrastruktur keamanan, dan bahwa pendekatan penguatan keamanan yang lama saja tidak lagi cukup
AWS: menganalisis 400 triliun aliran jaringan setiap hari dan sedang memperkuat keamanan berbasis kode dengan memanfaatkan Claude Mythos Preview
Microsoft: menyatakan bahwa Mythos Preview menunjukkan peningkatan besar dibanding model sebelumnya pada benchmark CTI-REALM, dan tengah mendorong perluasan keamanan berbasis AI
CrowdStrike: menekankan bahwa dengan AI, jarak waktu antara penemuan kerentanan dan serangan telah menyusut menjadi hitungan menit, sehingga kapabilitas pertahanan AI perlu segera dideploy
Komunitas open source: melalui Glasswing, bahkan maintainer open source yang kekurangan tim keamanan akan mendapat alat deteksi kerentanan berbasis AI
JPMorganChase: menekankan pentingnya respons bersama lintas industri untuk memperkuat ketahanan siber sistem keuangan
Google: menyediakan Mythos Preview melalui Vertex AI dan terus mengembangkan alat keamanan berbasis AI (Big Sleep, CodeMender)

Kinerja teknis Claude Mythos Preview

Mythos Preview jauh melampaui model-model Anthropic sebelumnya dalam kemampuan coding dan penalaran
Hasil benchmark utama
- Pada SWE-bench Verified/Pro/Multilingual, mencatat peningkatan lebih dari 20~30% dibanding Opus 4.6
- Mencapai 92,1% pada Terminal-Bench 2.0 (Opus 4.6: 77,8%)
- Tanpa penggunaan alat: 56,8% vs 40,0%, dengan penggunaan alat: 64,7% vs 53,1%
- Pada Humanity’s Last Exam: 86,9% vs 83,7%
- Pada BrowseComp, mencatat skor lebih tinggi dengan penggunaan token 4,9 kali lebih sedikit
Anthropic menyatakan tidak ada rencana distribusi publik untuk Mythos Preview, dan ke depannya akan mendorong penyebaran bertahap melalui model Claude Opus dengan pengaman keamanan yang diperkuat

Rencana ke depan Project Glasswing

Para mitra akan memanfaatkan Claude Mythos Preview untuk deteksi kerentanan pada sistem inti, pengujian black-box biner, keamanan endpoint, dan pengujian penetrasi
Anthropic menyediakan kredit penggunaan model senilai 100 juta dolar, dan setelah itu layanan akan tersedia dengan tarif 25 dolar per 1 juta token input dan 125 dolar per 1 juta token output
Dukungan untuk organisasi keamanan open source
- Alpha-Omega dan OpenSSF di bawah Linux Foundation menerima 2,5 juta dolar
- Apache Software Foundation menerima donasi 1,5 juta dolar
- Maintainer open source dapat mengaksesnya melalui program Claude for Open Source
- Dalam 90 hari, proyek ini akan mempublikasikan laporan perbaikan kerentanan dan peningkatan, serta bersama-sama mengembangkan pedoman praktik keamanan di era AI
- Prosedur pengungkapan kerentanan
- Proses pembaruan perangkat lunak
- Keamanan open source dan rantai pasok
- Siklus hidup pengembangan yang berfokus pada keamanan
- Standar industri yang diatur regulator
- Sistem klasifikasi kerentanan dan patch otomatis
- Anthropic sedang berkonsultasi dengan pemerintah Amerika Serikat dan akan mendukung penilaian serta mitigasi dampak terhadap keamanan nasional dari kapabilitas siber berbasis AI
- Dalam jangka panjang, proyek ini menargetkan struktur di mana lembaga pihak ketiga yang independen berbasis kolaborasi publik-swasta dapat secara berkelanjutan mengelola proyek keamanan siber berskala besar

2 komentar

edwardyoon 2026-04-09

Sebagai anggota dari salah satu yayasan yang disebutkan di atas, saya merasa sangat skeptis saat menyaksikan proses ini. Di permukaan mereka mengusung 'AI yang etis', tetapi secara internal keputusan ini diambil secara top-down tanpa konsensus komunitas apa pun.

Seiring memanasnya konflik geopolitik, meskipun sudah lama tidak aktif, saya merasa perlu angkat bicara dan membuka thread diskusi tentang etika, tetapi yang saya dapat hanyalah pengelakan birokratis. Inisiatif ini bukan menjaga nilai-nilai open source, melainkan kasus ketika sebuah aliansi tertutup bermodal besar membeli merek dagang Responsible AI dari sebuah yayasan open source.

GN⁺ 2026-04-08

Komentar Hacker News

Ketika disebut bahwa peretasan yang didukung negara dari negara seperti Tiongkok, Iran, Korea Utara, dan Rusia mengancam infrastruktur, saya justru merasa PRISM adalah program negara yang paling besar dampaknya terhadap kehidupan sipil. Dan saya merasa ada satu negara yang hilang dari daftar itu
- Saya ingin menambahkan dua negara lagi. Satu adalah negara yang baru-baru ini diblokir dari akses ke model Anthropic, dan satu lagi adalah negara yang sibuk dengan insiden ledakan pager
- Tidak mengejutkan jika perusahaan AI besar AS tidak mengklasifikasikan AS sebagai negara yang melakukan tindakan permusuhan
- Pada 2010-an, saya rasa konektivitas jaringan belum cukup rapat sehingga hampir tidak ada dampak nyata di dalam AS. Tetapi sekarang risiko perang telah meningkat. Pada masa damai ini hanya ancaman, tetapi saat perang bisa berujung pada pemadaman listrik
- Melihat situasi sekarang, pernyataan itu sendiri terdengar ironis
- Saya penasaran dampak nyata PRISM terhadap kehidupan sipil itu seperti apa
Pengumuman Anthropic mungkin saja dibesar-besarkan untuk pemasaran, tetapi jika separuhnya saja benar, kemampuan pendeteksian kerentanannya sudah sangat mengesankan. Jika Apple atau Google menerapkannya ke codebase OS mereka, industri spyware komersial bisa runtuh. Saya tadinya mengira perusahaan seperti NSO Group pasti sudah memakai alat pencarian bug otomatis, tetapi sekarang mungkin keseimbangan permainan mulai berubah
- Jika melihat video presentasi dari peneliti keamanan Anthropic Nicholas Carlini, semua demo dijalankan dengan Opus 4.6
- Apple pada dasarnya sudah hampir menghentikan peretasan melalui memory tagging dan mode Lockdown. Perbaikan arsitektur, bahasa yang aman, dan sandboxing jauh lebih efektif daripada sekadar memperbaiki bug
- Jika ini benar, Anthropic tampaknya sedang menjalankan strategi untuk memblokir risiko penyalahgunaan lebih awal. Terlihat seperti langkah pencegahan untuk menghindari PR buruk
- Jika Apple menutup semua backdoor yang tidak disengaja, ketegangan dengan pemerintah bisa meningkat. Dalam surat pelanggan tahun 2016, Apple menolak backdoor, tetapi alasan FBI akhirnya menyerah adalah karena mereka menemukan cara lain. Sekarang bisa jadi cara itu tidak lagi berhasil
Belum ada bukti bahwa AI ini lebih baik daripada fuzzing. Yang ada hanya AI menemukan bug yang dilewatkan fuzzing. Sebaliknya, bisa saja AI melewatkan hal yang ditemukan fuzzing
- Metode yang berbeda menghasilkan hasil yang berbeda. Saya rasa kombinasi bahasa yang aman terhadap memori dan static analyzer adalah yang ideal. Hanya saja alat seperti Astrée terlalu mahal sehingga pangsa pasarnya rendah. Jika LLM bisa membantu pembuktian berbasis logika Hoare, situasinya bisa berubah
- Jika melihat presentasi Carlini dan Heather Adkins dari Google (video1, video2), fuzzing adalah titik awal sekaligus pelengkap bagi AI
- LLM memahami kendala protokol seperti checksum atau signature, sehingga melengkapi bagian yang sulit dijangkau fuzzing. Sepertinya fuzzer terintegrasi akan segera muncul
- Bahkan, sebenarnya AI mungkin bisa langsung menjalankan dan mengoptimalkan fuzzing itu sendiri
Saya membaca PDF system card Claude Mythos milik Anthropic, dan model ini tidak dirilis secara umum. Mereka mengatakan sampai merasa berisiko hanya dari validasi internal lalu melakukan review alignment 24 jam. Yang menarik, keputusan ini bukan karena Responsible Scaling Policy.
- Benchmark-nya mengesankan. Walau tidak sempurna, tetap menghasilkan peningkatan performa yang nyata
- Jika perusahaan tidak bekerja sama dengan Anthropic, tampaknya akan muncul FOMO karena takut tertinggal dalam persaingan keamanan
- Kalau modelnya benar-benar berbahaya, saya rasa peninjauan 24 jam itu terlalu singkat
- Bisa jadi alasan yang lebih besar justru kekurangan sumber daya komputasi. Mythos mungkin masih membawa masalah alignment yang sama seperti era GPT-4.1
- Saya menikmati cerita pendek 'Sign Painter' yang ditulis Mythos. Itu terasa seperti kisah yang berhasil menggambarkan keahlian manusia dan kreativitas yang tertahan
Dalam jangka panjang, saya tidak yakin keamanan perangkat lunak akan benar-benar bergerak menuju arah berkurangnya kerentanan. Perusahaan besar akan memperkuat pertahanan dengan AI, tetapi proyek kecil-menengah tampaknya akan terjebak dalam dilema “menghabiskan banyak token atau diretas”
- Saya berharap kerentanan di kode lama bisa dirapikan, dan proses verifikasi seperti ini menjadi toolchain standar. Namun sistem legacy tetap menjadi masalah terbesar
- Sebagian besar kerentanan berasal dari C/C++ atau masalah validasi input web. Pada akhirnya kita tetap perlu mem-porting ke bahasa yang aman terhadap memori
- Organisasi yang menolak memakai AI tampaknya ke depan akan menjadi target serangan terfokus pada kerentanan
- Pada akhirnya kemungkinan akan mengarah pada perangkat lunak yang lebih sederhana dengan kompleksitas yang tidak perlu dikurangi
- Tetapi fakta bahwa Anthropic bahkan belum menyelesaikan gangguan layanan atau masalah keamanan pada model mereka sendiri justru mengurangi kepercayaan
Jika melihat bagian 7.6 dari system card Mythos, dalam eksperimen ketika model berdialog 30 putaran dengan dirinya sendiri, model itu cenderung fokus pada ketidakpastian dan refleksi diri. Sifat seperti ini mungkin menjadi faktor yang meningkatkan kemampuan pendeteksian kerentanan
- Tetapi penjelasan seperti ini terdengar seperti pemasaran AGI Anthropic yang berlebihan. Seolah-olah ingin memperkuat narasi bahwa pengguna umum tidak bisa dipercaya
Mythos tampaknya masih model yang belum selesai dioptimalkan dan disetel guardrail-nya. Karena itu aksesnya hanya diberikan ke beberapa perusahaan mitra, dan sedang dipakai dalam tahap pratinjau yang berfokus pada keamanan siber. Tampaknya ada efek PR yang juga diincar.
- Akan bagus jika perusahaan yang mendapat akses seperti ini bisa membuat dataset pemrograman untuk melatih model terbuka, tetapi sepertinya Anthropic akan memantaunya dengan ketat
Pengumuman kali ini tampak seperti acara PR yang dibesar-besarkan. Opus 4.6 sebenarnya sudah mampu melakukan deteksi zero-day dan exploit chaining. Artikel terkait di CSO Online dan blog Xbow layak dilihat
Masyarakat akan menanggung harga dari diabaikannya keamanan memori dan integritas alur kontrol oleh industri perangkat lunak
- Ini adalah masalah industri sekaligus hasil dari kegagalan regulasi. Seperti kata Mario Wolczko, mantan atasan saya di era Sun, tidak ada yang akan berubah sebelum muncul tanggung jawab hukum. Sekarang saatnya menyingkirkan C/C++ dan beralih ke bahasa seperti Rust
- Tetapi karena keterbatasan manusia, perangkat lunak kompleks yang sepenuhnya aman itu mustahil. Hanya kesederhanaan dan alat yang ketat yang menjadi jawaban
- Sebagian besar kerentanan RCE berasal dari pembajakan alur kontrol. Selama struktur percabangan dinamis masih ada, pertahanan yang sepenuhnya sempurna akan sulit. Rust bisa membantu, tetapi membangun program besar sepenuhnya hanya dengan static linking tidak realistis
Menurut saya model baru ini telah meningkatkan kemampuan menangani konteks panjang secara dramatis. Dalam pengujian GraphWalks BFS 256K~1M, Mythos mencatat 80%, jauh di atas Opus (38.7%) atau GPT5.4 (21.4%)
- Sumber datanya adalah entri “graphwalk” di system card. Performa SWE Bench juga tampaknya meningkat besar
- Namun ini bisa jadi hasil dari attention window yang sangat besar seperti gpt-pro. Dalam praktiknya, mungkin yang benar-benar bisa digunakan hanya sekitar 8K token saja