Tidak ada hak untuk melakukan relicensing pada proyek ini
(github.com/chardet)- Mark Pilgrim, penulis asli
chardet, menyoroti pelanggaran lisensi LGPL pada proyek tersebut dan menuntut agar peralihan ke lisensi MIT pada versi 7.0.0 baru-baru ini dibatalkan - Ia menyatakan bahwa meskipun para maintainer mengklaim ini sebagai “penulisan ulang total”, hasilnya tetap merupakan turunan yang ditulis dengan paparan langsung terhadap kode asli, sehingga harus tetap menggunakan LGPL
- Sejumlah pengembang mendiskusikan apakah penulisan ulang dengan bantuan AI benar-benar merupakan “clean room implementation”, serta apakah LLM telah dilatih menggunakan kode asli
- Sebagian menyinggung kompatibilitas API dan kemungkinan fair use, tetapi mayoritas mengkhawatirkan potensi pelanggaran hak cipta serta ketidakpastian hukum pada kode hasil AI
- Diskusi ini dipandang sebagai preseden penting terkait tanggung jawab hak cipta atas kode yang dihasilkan AI, prosedur perubahan lisensi proyek open source, dan batas kewenangan maintainer
Keberatan dari Mark Pilgrim
- Mark Pilgrim menyatakan bahwa dirinya adalah penulis asli
chardetdan proyek tersebut telah didistribusikan di bawah lisensi LGPL- Ia menyoroti bahwa klaim maintainer pada versi 7.0.0 bahwa mereka “memiliki hak untuk melakukan relicensing” adalah keliru
- Ia menegaskan bahwa kode di bawah LGPL, meskipun dimodifikasi, tetap harus dirilis dengan lisensi yang sama, dan klaim “penulisan ulang total” tidak memiliki dasar hukum
- Ia juga menyatakan bahwa “menambahkan code generator” tidak memberikan hak baru
- Pilgrim menuntut agar proyek tersebut dikembalikan ke lisensi LGPL semula
Respons awal komunitas
- Seorang pengguna bertanya apakah ada fork dari versi sebelum penulisan ulang berbantuan AI, dan pengguna lain memberikan tautan ke versi 6.0.0
- Sebagian setuju bahwa “secara hukum Mark benar”, sambil mengakui kemungkinan pelanggaran LGPL
- Pengguna lain menyebut bahwa “penulisan ulang melalui AI adalah trade-off yang tak terelakkan”, dari sudut pandang praktis
Diskusi hukum: API, hak cipta, dan fair use
- Seorang pengguna mengutip putusan Google LLC v. Oracle America, Inc. untuk menyebut bahwa API juga dapat dilindungi hak cipta
- Ia menjelaskan bahwa penulisan ulang demi kompatibilitas API bisa melanggar hukum jika tidak memenuhi syarat fair use
- Pengguna lain membantah dengan menyebut bahwa dalam kasus Google, hal tersebut diakui sebagai fair use
- Diskusi pun meluas ke legalitas penulisan ulang demi kompatibilitas API dan status hak cipta kode hasil AI
Perdebatan tentang generasi kode AI dan clean room implementation
- Sebagian berpendapat bahwa jika AI kemungkinan telah mempelajari kode asli, maka itu tidak bisa dianggap clean room implementation
- Apakah LLM telah dilatih menggunakan kode
chardetdapat menjadi faktor kunci dalam penilaian hukum
- Apakah LLM telah dilatih menggunakan kode
- Pengguna lain berargumen bahwa “jika AI menghasilkan kode hanya berdasarkan input dan output, itu mungkin saja sah”
- Namun, muncul sanggahan bahwa “kalau begitu, lisensi itu sendiri menjadi tidak bermakna”
- Ketidakjelasan tanggung jawab hak cipta pada kode AI dan sulitnya memverifikasi kepatuhan lisensi muncul sebagai isu utama
Kompatibilitas lisensi dan diskusi GPL
- Sebagian menyatakan bahwa lisensi MIT tidak kompatibel dengan GPL, tetapi pengguna lain mengutip dokumen resmi FSF untuk menjelaskan bahwa MIT (Expat) kompatibel dengan GPL
- Namun, banyak yang sepakat bahwa “melakukan relicensing atas kode LGPL menjadi MIT tetap merupakan pelanggaran”
- Pengguna lain juga menyoroti bahwa “tidak bisa mempertahankan reputasi dan repositori yang dibangun di atas kode LGPL sambil membuang kontrak lisensinya”
Data pelatihan AI dan persoalan kepercayaan
- Sejumlah pengguna mempertanyakan apakah orang bisa benar-benar percaya bahwa Claude tidak dilatih dengan kode LGPL
- Tidak bisa dilacaknya data pelatihan model AI disebut sebagai risiko hukum
- Sebagian berpendapat bahwa jika kode AI mengandung kemungkinan plagiarisme, maka penggunaannya sendiri sebaiknya dihindari
- Dengan mengutip riset, disebutkan statistik bahwa 2–5% kode AI mungkin merupakan salinan kode yang sudah ada
Identitas proyek dan kewenangan maintainer
- Sebagian berargumen bahwa jika seluruh kode kontribusi sebelumnya telah dihapus, maka versi baru bisa dianggap independen
- Namun, ada sanggahan bahwa tetap memakai nama dan reputasi yang sama adalah tidak tepat
- Ada juga pendapat bahwa “hak cipta melindungi ekspresi, bukan nama”
- Sebagian berpandangan bahwa jika maintainer benar-benar menghapus seluruh kode lama, maka mungkin tidak terjadi pelanggaran hukum, tetapi tidak ada bukti yang jelas yang diajukan
Pandangan menyeluruh komunitas
- Sejumlah pengguna menyatakan hormat pada kontribusi Mark Pilgrim dan Dan Blanchard, sambil menekankan perlunya memahami kompleksitas isu AI, hak cipta, dan tata kelola open source
- Diskusi berkembang ke tanggung jawab hukum kode hasil AI, keabsahan perubahan lisensi proyek, dan batas kewenangan maintainer open source
- Sebagian bahkan mengusulkan, “mari fork v7.0.0 dan kembalikan ke LGPL”
Ringkasan isu utama
- Legalitas perubahan LGPL → MIT: menurut banyak pihak, hal itu tidak mungkin dilakukan tanpa persetujuan penulis asli
- Status hak cipta penulisan ulang oleh AI: bisa dianggap sebagai karya turunan tergantung pada paparan terhadap data pelatihan
- Apakah ini clean room implementation: harus dibuktikan bahwa AI tidak merujuk pada kode asli
- Masalah penggunaan nama dan reputasi proyek: redistribusi dengan nama yang sama menimbulkan kontroversi hukum dan etika
- Keandalan kode AI: ada kekhawatiran soal risiko plagiarisme dan stabilitas rantai pasok
Isu ini dipandang sebagai contoh representatif soal hak cipta atas kode yang dihasilkan AI dan kepatuhan lisensi open source, dan berpotensi memengaruhi struktur tanggung jawab hukum alat pengembangan AI di masa depan.
1 komentar
Komentar Hacker News
Ada yang berpendapat Pilgrim salah memahami konsep hak cipta (clean room)
Klaim “ditulis ulang sepenuhnya” tidak terlalu penting. Secara hukum, implementasi independen itu dimungkinkan.
Clean room hanyalah perangkat prosedural untuk menyederhanakan gugatan, bukan syarat hukum bahwa seseorang tidak boleh pernah terpapar kode asli.
Linux pun pada praktiknya mengetahui struktur internal Unix, tetapi tetap diimplementasikan secara independen
Kemiripan rendah di JPlag tampak sebagai bukti yang cukup meyakinkan bahwa ini bukan plagiarisme
Klaim bahwa “kalau tahu codebase-nya maka penulisan ulang pun melanggar hak cipta” tidak sepenuhnya tepat
Pengetahuan internal itu masuk ranah paten, bukan hak cipta.
Namun, jika kode asli diletakkan di samping lalu hanya kalimatnya yang diubah, itu tetap pelanggaran.
Jika AI melihat kode asli lalu menghasilkan kode yang mirip, besar kemungkinan itu dipandang sebagai penyalinan paralel.
Tetapi jika ditulis sepenuhnya baru tanpa melihat aslinya, itu bisa saja sah. Hanya saja, secara hukum sulit dipertahankan sehingga dari sudut pandang perusahaan ini tetap harus dianggap risiko
Paten bisa dilanggar meskipun penemuan dilakukan secara independen, tetapi dalam hak cipta yang penting adalah independensi dalam penciptaan.
Namun jika seseorang menghasilkan karya yang identik dengan karya yang sudah pernah ia lihat, akan sulit meyakinkan juri
Pada akhirnya, jika ada kemiripan maka kemungkinan besar akan dinilai sebagai pelanggaran berdasarkan standar preponderance of evidence
Sebaliknya, jika ia sama sekali tidak mengenal karya aslinya, itu bisa diakui sebagai ciptaan independen
Ide itu sendiri tidak dilindungi, tetapi ekspresi dilindungi.
Jika LLM pernah melihat kode asli dalam proses pelatihan, itu menjadi area abu-abu secara hukum
Intinya adalah apakah ada pelanggaran LGPL.
Jika kode baru didasarkan pada kode asli, maka itu dianggap karya turunan dan LGPL harus tetap dipertahankan.
Meski diklaim sebagai “penulisan ulang total”, jika ada paparan terhadap kode asli maka itu bisa menjadi pelanggaran lisensi
Clean room hanyalah prosedur untuk pembelaan gugatan, dan beban pembuktian ada pada penggugat.
Linux dan alat GNU juga mengetahui Unix tetapi tetap sah
Ada yang melihat kasus menarik saat konsultasi.
Seorang engineer di perusahaan SaaS memakai Claude Code untuk merekayasa balik aplikasi perusahaannya sendiri dan membuat backend yang kompatibel dengan API hanya dalam seminggu.
Lalu muncul pertanyaan, “kalau pesaing melakukan hal seperti ini, bagaimana cara melindunginya?”
Jika kode itu sendiri adalah inti bisnis, maka sebenarnya sejak awal sudah berisiko.
Daripada mengkhawatirkan persaingan, lebih penting membuat produk yang lebih baik
Sekarang kita hidup di masa ketika ucapan seperti “mari reimplementasi Slack atau Drive” sudah tidak lagi terdengar mustahil
API adalah antarmuka publik sehingga bukan objek perlindungan
Seperti pada kasus reverse engineering IBM BIOS atau DOS, implementasi independen itu sah
Maintainer adalah trustee, bukan pemilik.
Ia tidak boleh seenaknya mengubah lisensi yang diberikan oleh pencipta asli.
Jika kodenya benar-benar baru, maka proyek harus dimulai dengan nama baru.
Pernyataan seperti “bekukan saja versi lama” dianggap bertentangan dengan semangat komunitas
Dalam komentar tahun 2021, sudah disebutkan bahwa “chardet berbasis LGPL sehingga tidak bisa dilisensikan ulang”.
Jika penulisan ulang itu dilakukan dengan mengetahui hal tersebut, maka itu adalah keputusan yang gegabah dan bentuk ketidakmenghormati pencipta asli
Jika AI menulis dalam keadaan sudah melihat kode asli, maka itu bukan implementasi clean room.
Kalau ada dua tim AI, satu membuat spesifikasi dan satu lagi mengimplementasikan, apakah itu bisa diterima?
Ini mengikuti preseden era IBM, tetapi jika modelnya sendiri sudah dilatih dengan karya asli, masalahnya tetap ada
Namun, harus diverifikasi bahwa spesifikasi tersebut tidak mengandung elemen ekspresif
Jika karya asli ada di data pelatihan, maka perbandingan itu sendiri menjadi tidak bermakna
Seperti lelucon “kalau menyalin-tempel Wikipedia lalu mengganti beberapa kata apakah itu aman?”,
pada akhirnya penghindaran yang disengaja memang tidak mungkin berhasil.
Kita hidup di masa ketika sulit untuk percaya sampai-sampai versi dependency harus dipatok
Padahal hukum menekankan penilaian secara keseluruhan.
Pengadilan menilai dengan standar “preponderance of evidence”, dan sekadar mengganti kata tidak otomatis menjadikannya karya baru.
Jika karya asli itu esensial, besar kemungkinan akan dianggap karya turunan.
Jika karya asli ada dalam data pelatihan, diperkirakan gugatan pelanggaran hak cipta akan sulit dihindari
Di sisi lain, menarik bahwa Mark Pilgrim muncul lagi
Di halaman Wikipedia-nya ada kisah tentang dirinya yang “menghilang dari Internet”.
Buku-buku Python karyanya masih layak direkomendasikan
Ada yang heran, “kalau AI dilatih dengan kode GPL, bukankah berarti semua kode AI menjadi terkontaminasi GPL (taint)?”
Prosedur clean room di AS hanyalah strategi untuk mempersingkat litigasi