Pengumuman proyek Purple Llama
- Purple Llama adalah proyek yang menyediakan alat dan evaluasi kepercayaan serta keamanan terbuka untuk membantu pengembang menerapkan model AI generatif secara bertanggung jawab.
- CyberSec Eval adalah kumpulan tolok ukur evaluasi keamanan siber untuk LLM, sedangkan Llama Guard adalah pengklasifikasi keamanan untuk pemfilteran input/output yang mudah diterapkan.
- Bekerja sama dengan AI Alliance, AMD, AWS, Google Cloud, Hugging Face, IBM, Intel, Lightning AI, Microsoft, MLCommons, NVIDIA, Scale AI, dan lainnya, alat-alat ini akan disediakan bagi komunitas open source.
Inovasi baru dalam AI generatif
- AI generatif adalah teknologi inovatif yang memungkinkan AI percakapan, pembuatan gambar realistis, peringkasan dokumen skala besar, dan lainnya.
- Model Llama telah diunduh lebih dari 100 juta kali, dan inovasi seperti ini dipimpin oleh model terbuka.
- Kolaborasi keamanan penting agar pengembang dapat membangun kepercayaan serta melakukan riset dan kontribusi AI yang bertanggung jawab.
Langkah pertama proyek Purple Llama
- Keamanan siber dan keamanan prompt LLM saat ini merupakan bidang penting dalam keamanan AI generatif.
- Tolok ukur evaluasi keamanan siber dibangun berdasarkan panduan dan standar industri seperti CWE dan MITRE ATT&CK, serta dikembangkan melalui kolaborasi dengan para pakar keamanan.
- Llama Guard menyediakan model yang tersedia secara publik agar pengembang dapat melindungi diri dari keluaran yang berbahaya.
Pentingnya tim Purple
- Tantangan AI generatif hanya dapat dikurangi dengan mengambil posisi serangan (red team) dan pertahanan (blue team) sekaligus.
- Tim Purple adalah pendekatan kolaboratif yang mencakup tanggung jawab red team dan blue team, dan semangat yang sama diterapkan pada AI generatif.
Upaya menuju ekosistem terbuka
- Meta menjadikan riset eksploratif, open science, dan kolaborasi lintas pihak sebagai fondasi upaya AI-nya, dan ada peluang penting untuk membangun ekosistem terbuka.
- Mereka berencana mendorong kepercayaan dan keamanan terbuka bersama banyak mitra seperti AI Alliance, AMD, Anyscale, AWS, dan lainnya.
Arah ke depan
- Mereka akan mengadakan workshop di NeurIPs 2023 untuk membagikan alat-alat ini dan memberikan analisis teknis yang mendalam.
- Pedoman keamanan dan praktik terbaik memerlukan dialog berkelanjutan, dan mereka menantikan masukan dari komunitas.
Opini GN⁺
- Hal terpenting dari artikel ini adalah bahwa Meta mengumumkan proyek Purple Llama untuk mendukung penggunaan teknologi AI generatif baru yang aman dan bertanggung jawab.
- Proyek ini bertujuan membantu pengembang menerapkan AI generatif secara aman dengan mencakup alat evaluasi keamanan siber dan model pemfilteran input/output.
- Upaya ini diharapkan berkontribusi pada percepatan perkembangan teknologi AI, membangun kepercayaan di komunitas pengembang, dan memperkuat ekosistem open source.
1 komentar
Komentar Hacker News