- GPT-2 adalah kecerdasan buatan pembuat teks berskala besar yang dilatih dengan 8 juta halaman web, dan menunjukkan kemampuan untuk melanjutkan kalimat yang diberikan secara alami
- OpenAI menyatakan model ini berisiko disalahgunakan untuk berita palsu atau peniruan identitas online, sehingga mereka hanya merilis versi yang diperkecil alih-alih model penuh
- Para peneliti menilai langkah tidak membuka penuh ini hanya merupakan respons sementara, dan model serupa akan segera bisa direproduksi
- Sebagian pihak mengkritik OpenAI karena melebih-lebihkan risikonya demi menarik perhatian, sementara pakar lain menilainya sebagai pemicu diskusi etika AI
- Kasus ini menjadi titik balik penting yang menunjukkan bagaimana menyeimbangkan tanggung jawab dalam membuka AI dan tak terelakkannya penyebaran teknologi
Penundaan rilis GPT-2 oleh OpenAI dan perdebatan etika kecerdasan buatan
- OpenAI mengembangkan model pembuat teks baru GPT-2 yang mampu menghasilkan kalimat konsisten sesuai topik yang diberikan, tetapi menunda perilisan model penuhnya karena alasan keselamatan dan keamanan
- Sebagai gantinya, OpenAI hanya merilis versi yang diperkecil, dan tetap tidak membuka dataset serta kode pelatihan yang digunakan
- Media menggambarkan ini secara berlebihan sebagai “kecerdasan buatan yang harus disegel demi umat manusia”, dan para pakar memunculkan diskusi bahwa ada pembesaran ancaman
- Keputusan ini memicu perdebatan tentang sampai sejauh mana cakupan pembukaan algoritme AI yang berpotensi berbahaya seharusnya diizinkan
Karakteristik teknis dan performa GPT-2
- GPT-2 adalah model bahasa yang dilatih dengan teks dari 8 juta halaman web, menggunakan metode memprediksi kata berikutnya dalam sebuah kalimat
- Model ini dapat menghasilkan kalimat lanjutan yang alami sesuai gaya dan topik dari kalimat masukan
- Sebagai contoh, ketika diberi kalimat “menemukan kawanan unicorn yang bisa berbahasa Inggris di Pegunungan Andes”, GPT-2 menyelesaikannya menjadi teks bergaya artikel ilmiah fiktif
- Model ini juga dapat menghasilkan teks dalam beragam gaya penulisan seperti novel, kolom opini, dan pidato
- Kalimat yang dihasilkan kadang mengandung pengulangan, perpindahan topik yang tidak mulus, atau isi yang tidak logis, tetapi dinilai jauh meningkat dibanding model sebelumnya dalam pemahaman konteks dan konsistensi kalimat
- GPT-2 mampu membedakan makna ganda kata dan mengenali penggunaan yang langka, serta berpotensi diterapkan pada terjemahan, chatbot, dan alat bantu menulis
Keputusan menunda rilis dan perdebatan di sekitarnya
- OpenAI khawatir GPT-2 dapat disalahgunakan untuk membuat berita palsu, meniru identitas orang di internet, dan menyebarkan spam
- Karena itu, mereka hanya merilis versi yang diperkecil, sementara data pelatihan dan kodenya tetap tidak dibuka
- Namun, banyak peneliti AI menilai langkah tidak membuka ini hanya merupakan respons sementara
- Robert Frederking dari Carnegie Mellon menyatakan, “Teknologi yang digunakan OpenAI bukan hal baru, dan peneliti lain juga akan segera dapat membuat model serupa.”
- Muncul pula pendapat bahwa lembaga dengan modal dan pengetahuan yang memadai bahkan dapat membangun model serupa hanya dengan layanan cloud seperti AWS
- Sebagian peneliti mengkritik OpenAI karena melebih-lebihkan risikonya demi menarik perhatian dan membatasi peluang riset di kalangan akademik
- Sebaliknya, David Bau dari MIT menilai keputusan ini sebagai gestur untuk memicu diskusi etika AI, dan mengatakan, “Hal positifnya adalah OpenAI membuat orang memberi perhatian pada masalah ini.”
Persoalan keterbukaan AI dan penilaian etis
- John Bowers dari Berkman Klein Center Harvard menjelaskan bahwa apakah teknologi AI perlu dibuka atau tidak adalah persoalan analisis biaya-manfaat
- Ia menyatakan mendukung pembukaan algoritme pembuat teks yang berkontribusi pada kemajuan pemrosesan bahasa alami, tetapi mengatakan teknologi pengenalan gambar yang dapat disalahgunakan untuk pengawasan atau manipulasi perlu diperlakukan dengan hati-hati
- Ia secara khusus menyoroti teknologi deepfake sebagai sesuatu yang “mudaratnya jauh lebih besar daripada manfaatnya”
- Bowers menilai penilaian seperti ini menunjukkan ketidakmatangan bidang AI
- Saat ini, bidang machine learning masih kekurangan standar sistematis untuk menilai dampak sosial teknologi dan pertimbangan etisnya
Batas pengendalian penyebaran teknologi dan contoh sejarah yang serupa
- Seperti terlihat dalam sejarah belakangan ini, upaya menekan atau mengendalikan penyebaran alat AI kemungkinan besar akan gagal
- Frederking mengajukan kegagalan regulasi teknologi enkripsi pada 1990-an sebagai preseden serupa
- Saat itu pemerintah mendorong rancangan kewajiban pemasangan backdoor untuk penyadapan komunikasi, tetapi upaya itu dilumpuhkan ketika Phil Zimmerman mengembangkan alat enkripsi PGP
- Setelah itu, teknologi enkripsi kuat juga menjadi mudah diperoleh dari luar negeri, dan regulasi praktis menjadi mustahil
- Frederking menegaskan, “Ketika waktunya kemajuan ilmiah tiba, kita tidak bisa menghentikannya. Yang bisa kita lakukan hanyalah memutuskan bagaimana meresponsnya.”
Kesimpulan
- Penundaan rilis GPT-2 dinilai sebagai kasus penting terkait risiko teknologi AI dan tanggung jawab keterbukaan
- Keputusan OpenAI menyoroti persoalan keseimbangan antara etika AI, transparansi, dan tak terelakkannya penyebaran teknologi
- Dalam jangka panjang, diperlukan standar yang dapat menyelaraskan keterbukaan riset AI dengan keamanan sosial
7 komentar
Tepatnya, sepertinya ini diangkat karena alasan OpenAI pada masa Amodei tidak merilis GPT-2 secara penuh mirip dengan alasan tidak membuka model Mysos. Amodei saat itu dan Amodei sekarang tidak ada bedanya..
Kalau dilihat sekarang memang jadi terasa lucu ya wkwkwk. Menakutkan juga melihat situasi yang dalam waktu belum sampai 10 tahun sudah jadi terasa nyaris konyol seperti ini.
Sebagai referensi, jika melihat isi tulisan yang menyebut GPT-2 atau tahun penulisan asli 2019, Anda akan paham bahwa konteksnya adalah bahwa baru-baru ini Anthropic mengatakan tidak akan merilis model Mythos karena terlalu berbahaya, dan dalam konteks itu dulu OpenAI juga sempat dianggap berlebihan soal GPT-2.
Dalam kasus HN, tampaknya ada kebiasaan menambahkan tahun untuk posting lama (saya tidak tahu apakah itu ditambahkan secara otomatis), dan menurut saya akan bagus juga jika GeekNews menampilkannya.
Sebagian besar seharusnya ikut terbawa, tetapi yang ini anehnya malah terlewat saat diproses. Saya akan memperbaikinya agar ini tidak tersentuh.
Apakah Sam Altman sedang berempati dengan Oppenheimer? Kalau memang berbahaya, seharusnya bisa dirilis setelah dilengkapi dengan pengamanan yang memadai, jadi menurut saya menganjurkan orang untuk memakainya itu tidak konsisten. Saya rasa kasus Anthropic Mythos juga sama.
Saya percaya pada apa yang dikatakan Anthropic, tetapi kenapa saya jadi tidak terlalu percaya pada yang dikatakan OpenAI?
Apakah karena Anthropic melakukan show-and-proof dengan membuat patch zero-day?
Atau karena OpenAI sudah beberapa kali memakai repertoar ini?
Komentar Hacker News
Rasanya seseorang perlu mengumpulkan momen-momen legendaris OpenAI seperti ini
Misalnya hal-hal seperti “GPT-2 terlalu berbahaya”, “DALL-E 64x64 terlalu menakutkan”, “mencapai AGI”, atau “Q*/strawberry memecahkan soal matematika sampai para peneliti panik”
Aku juga suka Codex, tapi promosi yang dibesar-besarkan seperti ini terasa lucu sekaligus melelahkan
Seharian ini aku mencoba memperbaiki bug UI sederhana dengan Codex GPT-5.4, Claude Opus 4.6-1M, Gemini 3.1 Pro, dan lainnya, tapi gagal, jadi akhirnya kubuka kodenya sendiri dan kuperbaiki
Selesai dalam 20 menit, dan yang lucu, aku sama sekali tidak tahu bahasa atau framework ini
Meski begitu, karena akhirnya selesai dalam 20 menit, harus hati-hati — bisa jadi kamu baru saja mempelajari sesuatu
Menurutku itu cara terbaik untuk menjaga model mental tetap jelas
Model AI memang benar-benar buruk dalam urusan bug UI atau CSS. Unit test itu wajib
Kontroversi ini tampaknya merupakan reaksi terhadap Mythos, tetapi menurutku keputusan OpenAI saat itu memang benar
Ketika GPT-2 dirilis, industrinya berubah total, dan itu bukan sekadar riset, melainkan sinyal era baru
Mythos juga, dengan caranya sendiri, menunjukkan sesuatu yang belum pernah ada sebelumnya
Aku membaca white paper setebal 250 halaman itu; kemampuan hacking-nya sangat mengejutkan, dan dalam sebulan terakhir terasa ada peningkatan keamanan yang besar
Meluangkan lebih banyak waktu dengan mempertimbangkan dampak sosial adalah hal yang positif
Meski awalnya benar secara tidak sengaja, belakangan ini ledakan konten berkualitas rendah memang tampak seperti masalah nyata
Mereka mengatakan bahwa “gambar, audio, dan video sintetis akan menurunkan biaya produksi konten palsu, dan publik harus menjadi lebih skeptis terhadap teks online”, dan sekarang memang persis begitu keadaannya
Artikel terkait
Awalnya aku tidak melihat tahunnya dan sempat kaget
OpenAI sedang kesulitan menggalang investasi, dan profil Altman di New Yorker juga tidak terlalu bagus, jadi masuk akal kalau mereka kembali ke strategi PR ala “tolong cegah nenek menembak orang”
Ada yang bilang, “kalau teknologinya benar-benar berbahaya, tidak mungkin dijual ke publik seharga 20 dolar per bulan”
Hal yang benar-benar berbahaya tidak akan pernah dilepas ke masyarakat umum
Tetap saja aneh melihat para ahli mengabaikan logika dasar seperti ini
Belakangan ini ungkapan “terlalu berbahaya untuk dirilis” merujuk pada Mythos milik Anthropic
Katanya model itu terlalu kuat sehingga hanya perusahaan yang disetujui yang bisa mengaksesnya
“Terlalu berbahaya untuk dirilis” sebenarnya berarti “bobot model tidak dirilis sebagai open source”
Pada akhirnya bobotnya juga dirilis, dan konteksnya berbeda dengan Anthropic Mythos
Pada masa itu aku melatih Transformer-XL bersama Ben Mann dari luar OpenAI
Awalnya kami ingin merilis bobotnya seperti GPT-2.5, tetapi teman-teman di OpenAI menyarankan agar tidak dipublikasikan
Tulisan terkait
Setelah itu ia menulis rinci pengalamannya
Ia mengatakan OpenAI berbicara dengan sopan dan tulus, serta menjelaskan sudut pandang pemerintah dan badan intelijen soal risikonya
Akhirnya ia memutuskan tidak merilis model itu dengan pemikiran bahwa “mencegah lebih baik daripada mengobati”
Katanya ia ingin meninggalkan preseden untuk saat model yang lebih berbahaya muncul nanti
Tulisan bagus selalu muncul setelah orang Amerika tidur
Aku masih ingat contoh artikel unicorn yang dihasilkan GPT-2 yang kubaca pada 2019
Waktu itu benar-benar mengejutkan. Bahkan terasa lebih mengejutkan daripada GPT-3.5 atau 4