- Akibat perintah pengadilan, OpenAI harus menyimpan semua log pengguna ChatGPT, termasuk percakapan yang sudah dihapus, dan OpenAI membantah bahwa langkah ini merupakan pelanggaran privasi yang serius
- OpenAI menyatakan perintah tersebut dijatuhkan segera tanpa dasar yang memadai, mengikuti klaim perusahaan-perusahaan berita dalam gugatan hak cipta yang meminta pelestarian bukti
- OpenAI memperingatkan bahwa perintah ini akan memaksanya menyimpan data pribadi ratusan juta pengguna dan bahkan data rahasia perusahaan, sehingga menimbulkan risiko pelanggaran regulasi privasi global serta beban rekayasa yang besar
- Sejak perintah diberlakukan, percakapan yang dihapus pengguna dan percakapan sementara pun dipaksa disimpan secara permanen, memicu kecemasan dan kekhawatiran besar di media sosial dan tempat lain
- OpenAI kembali meminta pencabutan perintah demi hak kontrol data pengguna dan perlindungan privasi, serta menyatakan akan terus melanjutkan perlawanan hukum
Penolakan OpenAI terhadap Perintah Penyimpanan Data yang “Sangat Pribadi”
Latar Belakang Perintah Pengadilan dan Pokok Sengketa
- OpenAI mengajukan protes ke pengadilan demi melindungi privasi jutaan pengguna ChatGPT, dan menentang keras perintah untuk menyimpan semua log pengguna, termasuk percakapan yang dihapus dan percakapan API
- Perintah tersebut dikeluarkan dalam proses gugatan pelanggaran hak cipta setelah pihak perusahaan berita menuduh OpenAI sedang memusnahkan bukti, dan OpenAI menegaskan bahwa keputusan itu dibuat terburu-buru tanpa verifikasi fakta atau penjelasan yang memadai
- Pihak penggugat dalam perkara itu berargumen bahwa saat mengakses artikel berita berbayar secara mem-bypass lewat ChatGPT, pengguna akan menghapus percakapan untuk menghilangkan jejak, namun tidak ada bukti yang diajukan untuk mendukung klaim tersebut
- Berdasarkan dugaan itu, pengadilan memerintahkan OpenAI untuk secara terpisah menyimpan semua log percakapan ke depan, termasuk yang dihapus, dan OpenAI memperingatkan bahwa langkah ini meningkatkan risiko pelanggaran hak kontrol data pengguna serta pelanggaran hukum privasi global
Argumen OpenAI dan Tanggapan Hukumnya
- OpenAI menekankan bahwa perintah pelestarian yang kali ini luar biasa luasnya melanggar hak privasi pengguna, dan bahwa pengguna harus dapat memilih sendiri kapan dan bagaimana data mereka disimpan
- Sebelum perintah pengadilan dikeluarkan, OpenAI memiliki mekanisme di mana bila pengguna menghapus percakapan secara langsung atau memakai fitur percakapan sementara, percakapan tersebut akan dihapus sepenuhnya dalam 30 hari dari sistem
- Namun akibat perintah ini, OpenAI kini harus menyimpan secara paksa semua permintaan penghapusan dan percakapan sementara, sehingga data pribadi ratusan juta pengguna dan data API perusahaan, termasuk informasi rahasia, akan disimpan dalam jangka panjang
- Selain kekhawatiran privasi, OpenAI juga menyoroti bahwa pelaksanaan perintah tersebut memerlukan sumber daya engineering dan biaya yang sangat besar, serta berpendapat bahwa kerugian bagi OpenAI dan pengguna jauh lebih besar daripada manfaat spekulatif bagi pihak perusahaan berita
- OpenAI meminta sidang lisan di pengadilan dan menuntut pencabutan perintah tersebut (pembatalan segera)
Reaksi Pengguna dan Industri
- Setelah fakta bahwa perintah itu mulai diberlakukan diketahui publik, banyak pengguna dan pelanggan perusahaan mengungkapkan kecemasan mereka di media sosial seperti LinkedIn dan X
- Sejumlah pakar memperingatkan bahwa perintah ini bisa menjadi pelanggaran kontrak yang serius terhadap semua pelanggan enterprise OpenAI, dan perusahaan yang menangani data rahasia melalui API akan terekspos pada risiko keamanan yang lebih besar
- Di media sosial, pendapat seperti “semua layanan AI melalui OpenAI kini terekspos ancaman privasi” dan “disarankan beralih ke layanan alternatif seperti Mistral AI, Google Gemini, dan lainnya” mulai meluas
- Seorang pakar keamanan menilai bahwa “perintah seperti ini adalah risiko keamanan yang tidak dapat diterima”
- Muncul pula kritik seperti, “Hakim Wang tampaknya menganggap logika hak cipta NYT lebih penting daripada privasi semua pengguna OpenAI—gila”
Kebijakan OpenAI dan Prospek ke Depan
- OpenAI sebelumnya secara ketat mematuhi kebijakan penyimpanan data pengguna, dan telah menghapus seluruh riwayat percakapan dalam 30 hari setelah akun dihapus
- Akibat perintah pengadilan, proses pengelolaan dan penghapusan data yang ada selama ini lumpuh seketika, dan pengguna kini berada dalam situasi di mana semakin sulit untuk mempercayai bahwa data mereka benar-benar dihapus dengan aman
- OpenAI berencana terus melanjutkan perjuangan hukum dan secara aktif menyampaikan ketidakadilan perintah tersebut serta kerugian nyata yang ditimbulkannya
1 komentar
Komentar Hacker News
Menyoroti bahwa risiko yang sama juga ada saat memakai model GPT lewat API
Saya rasa ini akan segera menjadi masalah yang dihadapi semua perusahaan AI
Kecuali semuanya beralih ke lingkungan yang meng-host model secara langsung, dalam model bisnis seperti SaaS kenyataannya perlindungan privasi pengguna tidak terlalu dianggap penting ketika profitabilitas diperhitungkan
Sejujurnya, kebanyakan orang sudah terbiasa dengan kenyataan bahwa privasi di internet pada dasarnya tidak ada
Namun perusahaan atau individu yang menyerahkan kode sumber tertutup atau data terkait keamanan berdasarkan kepercayaan jelas akan sangat terdampak
Tapi untuk hal seperti itu, pada dasarnya memang tidak seharusnya di-outsource ke vendor mana pun
Perusahaan yang sudah mapan kini perlu meninjau ulang kontrak yang ada, regulasi, dan batas toleransi risiko mereka akibat isu ini
Startup pembungkus layanan berbasis ChatGPT juga perlu memeriksa ulang kebijakan privasi mereka, dan secara jelas menyatakan bahwa pengguna sedang melepaskan privasi mereka
Semua integrasi GPT yang saya adopsi dilakukan melalui layanan Azure karena ada kewajiban kontraktual untuk tidak melatih model dengan data saya
Setahu saya, layanan Azure, yakni Microsoft, tidak termasuk dalam putusan kali ini
Jika kamu menangani kode proprietari, seharusnya sejak awal memang tidak memakai cloud LLM, dan isu kali ini membuat fakta itu terasa makin jelas
Menanggapi pertanyaan bagaimana ini bisa merugikan bisnis, ditekankan bahwa ini adalah langkah penyimpanan data untuk menghadapi risiko hukum, bukan untuk tujuan pelatihan
Saya rasa dalam kontrak dengan perusahaan lain juga bisa dicantumkan secara eksplisit bahwa data tidak akan dipakai untuk pelatihan
Artikel latar belakang yang lebih rinci bisa dilihat di sini
Tautan ini adalah sumber materi yang sebenarnya
Sepertinya lebih baik memperbarui tautannya ke tulisan tersebut
Saya membagikan ini karena komentar-komentar di bawah artikel itu benar-benar lucu nuansanya
Rasanya seperti sindiran yang menggambarkan para pendukung hak cipta sebagai kubu anti-AI
Secara pribadi saya tidak suka sikap arogan OpenAI terhadap konten milik orang lain, tetapi di sisi lain saya juga sulit bersimpati pada tuntutan pemegang hak cipta yang terlalu berlebihan
Menurut saya AI generatif dan persoalan pelatihan menampakkan dengan sangat jelas betapa ketinggalan zamannya beberapa unsur dalam hukum kekayaan intelektual saat ini
Perubahan memang diperlukan ke depan, tetapi perubahan itu tidak boleh hanya menguntungkan perusahaan besar atau orang kaya, melainkan harus membantu orang biasa
Saya umumnya kritis terhadap pelanggaran hak cipta oleh LLM, tetapi cara logika putusan ini disusun terasa agak aneh
Intinya, hakim mengemukakan skenario hipotetis bahwa seorang pengguna bisa memakai ChatGPT untuk melewati paywall dan mengekstrak konten New York Times, lalu setelah mengetahui perkara ini meminta semua catatan keluaran yang pernah diterimanya dihapus, dan itu dianggap bisa menghindari tujuan putusan
Mendengar putusan seperti ini justru menimbulkan pertanyaan apakah pengguna tidak akan menjadi lebih berhati-hati selama periode tersebut
Kritiknya adalah bahwa kini meskipun pengguna menghapus riwayat percakapan atau memakai fitur Temporary Chat untuk percakapan sementara, OpenAI tetap harus menyimpan log karena perintah hukum, sehingga apa bedanya dengan riwayat browser web biasa
Kalau Safari sampai diwajibkan menyimpan riwayat yang sudah dihapus pengguna pun tidak, jadi aneh mengapa hanya OpenAI yang dipaksa secara khusus
Ada yang mengusulkan tautan artikel yang lebih baik di thread
Itu adalah tautan ke artikel asli Ars Technica
Ditambahkan bahwa sebaiknya merujuk ke artikel yang berisi informasi nyata, bukan sekadar postingan Mastodon
Belakangan ini ada banyak kolom opini pribadi di Hacker News yang membahas kelebihan atau kekurangan LLM, tetapi cenderung sama sekali tidak menyinggung masalah privasi
Alasan utama saya tidak memakai LLM atau menempelkan kode sumber ke jendela prompt adalah privasi
Perusahaan kami akan langsung melanggar aturan jika kode keluar dari server karena NDA dan regulasi pemerintah seperti ITAR
Isu kali ini menunjukkan bahwa privasi adalah tumit Achilles bagi LLM
Sebelum LLM mapan dalam bentuk on-premise, masalah ini tidak akan bisa dihindari
Sangat mudah dan sederhana untuk membangun LLM sendiri secara langsung
Situasi di mana OpenAI terpaksa menyimpan data di server dapat berujung pada tim hukum perusahaan yang sedang berperkara bisa melihat riwayat percakapan pengguna dengan ChatGPT melalui proses discovery
Misalnya, pengacara NYT di pengadilan bisa saja membaca percakapan pribadi seseorang sebagai bahan bukti
Ada pendapat bahwa solusi yang lebih baik adalah menyimpan log percakapan setelah dianonimkan
OpenAI secara teknis mungkin bisa melakukan anonimisasi ini, dan itu tampak seperti solusi paling optimal
Data semacam ini bisa dicadangkan ke solusi berbasis tape storage seperti pustaka Spectra TFinity ExaScale, atau ke sistem pengarsipan mendalam seperti AWS Glacier
Dalam struktur seperti ini, pemulihan data bisa memakan waktu beberapa jam hingga beberapa hari, sehingga perintah pengadilan tetap dipatuhi, biaya juga murah, dan bahkan dalam kebocoran data skala besar pun pencurinya perlu waktu dan upaya besar sehingga lebih menguntungkan untuk deteksi dan pertahanan
Sekarang semua chat/API call dengan AI berbasis cloud di AS harus dicurigai dengan asumsi bahwa semuanya merupakan objek pencarian hukum
Jika itu adalah risiko yang tidak bisa ditanggung, maka perlu serius mempertimbangkan beralih ke LLM lokal
Ada yang mempertanyakan bagaimana media seperti Times bisa memiliki hak untuk melihat data pengguna
Pada akhirnya, putusan seperti ini membuat pihak surat kabar dapat mengintip data pengguna
Perintah pengadilan ini berpotensi melanggar hukum privasi di lebih dari satu yurisdiksi, dan juga bisa membuat OpenAI melanggar kontrak yang sudah ada dengan pelanggan lama
Penjelasannya adalah bahwa kontrak yang sudah ada tidak punya pengaruh apa pun terhadap perintah pengadilan
Perintah hukum adalah yang tertinggi
Perintah kali ini sendiri bukan berarti menciptakan pelanggaran hukum privasi yang baru
Sejak awal, penyimpanan data dan pemberiannya kepada pihak ketiga itulah yang merupakan pelanggaran
Perintah ini pada praktiknya berlaku surut sampai 13 Mei
Terasa bahwa alasan OpenAI tidak memberi tahu pengguna lewat email terpisah atau cara lain sampai sekarang adalah karena dampak bisnisnya
Namun, ini terasa seperti tindakan yang jelas-jelas mengkhianati kepercayaan pengguna
Perusahaan yang selama ini mengirim dan menerima data sensitif lewat ChatGPT API kemungkinan percaya pada penjelasan bahwa data input dan output tidak disimpan
Kenyataannya, OpenAI bisa saja meninggalkan data hanya dengan mengubah pengaturan
Saya penasaran apakah ada pemberitahuan terpisah yang dikirim, atau semua orang baru mengetahui hal ini lewat laporan media
Tautan postingan asli sempat tidak bisa diakses karena lonjakan trafik (HN hug of death), tetapi ada yang berhasil membacanya lewat Wayback Machine
Karena itu adalah instance Mastodon pribadi, wajar jika mendadak kelebihan beban saat pengunjung melonjak