1 poin oleh GN⁺ 2026-03-06 | 1 komentar | Bagikan ke WhatsApp
  • Mark Pilgrim, penulis asli chardet, menyoroti pelanggaran lisensi LGPL pada proyek tersebut dan menuntut agar peralihan ke lisensi MIT pada versi 7.0.0 baru-baru ini dibatalkan
  • Ia menyatakan bahwa meskipun para maintainer mengklaim ini sebagai “penulisan ulang total”, hasilnya tetap merupakan turunan yang ditulis dengan paparan langsung terhadap kode asli, sehingga harus tetap menggunakan LGPL
  • Sejumlah pengembang mendiskusikan apakah penulisan ulang dengan bantuan AI benar-benar merupakan “clean room implementation”, serta apakah LLM telah dilatih menggunakan kode asli
  • Sebagian menyinggung kompatibilitas API dan kemungkinan fair use, tetapi mayoritas mengkhawatirkan potensi pelanggaran hak cipta serta ketidakpastian hukum pada kode hasil AI
  • Diskusi ini dipandang sebagai preseden penting terkait tanggung jawab hak cipta atas kode yang dihasilkan AI, prosedur perubahan lisensi proyek open source, dan batas kewenangan maintainer

Keberatan dari Mark Pilgrim

  • Mark Pilgrim menyatakan bahwa dirinya adalah penulis asli chardet dan proyek tersebut telah didistribusikan di bawah lisensi LGPL
    • Ia menyoroti bahwa klaim maintainer pada versi 7.0.0 bahwa mereka “memiliki hak untuk melakukan relicensing” adalah keliru
    • Ia menegaskan bahwa kode di bawah LGPL, meskipun dimodifikasi, tetap harus dirilis dengan lisensi yang sama, dan klaim “penulisan ulang total” tidak memiliki dasar hukum
    • Ia juga menyatakan bahwa “menambahkan code generator” tidak memberikan hak baru
  • Pilgrim menuntut agar proyek tersebut dikembalikan ke lisensi LGPL semula

Respons awal komunitas

  • Seorang pengguna bertanya apakah ada fork dari versi sebelum penulisan ulang berbantuan AI, dan pengguna lain memberikan tautan ke versi 6.0.0
  • Sebagian setuju bahwa “secara hukum Mark benar”, sambil mengakui kemungkinan pelanggaran LGPL
  • Pengguna lain menyebut bahwa “penulisan ulang melalui AI adalah trade-off yang tak terelakkan”, dari sudut pandang praktis

Diskusi hukum: API, hak cipta, dan fair use

  • Seorang pengguna mengutip putusan Google LLC v. Oracle America, Inc. untuk menyebut bahwa API juga dapat dilindungi hak cipta
    • Ia menjelaskan bahwa penulisan ulang demi kompatibilitas API bisa melanggar hukum jika tidak memenuhi syarat fair use
  • Pengguna lain membantah dengan menyebut bahwa dalam kasus Google, hal tersebut diakui sebagai fair use
  • Diskusi pun meluas ke legalitas penulisan ulang demi kompatibilitas API dan status hak cipta kode hasil AI

Perdebatan tentang generasi kode AI dan clean room implementation

  • Sebagian berpendapat bahwa jika AI kemungkinan telah mempelajari kode asli, maka itu tidak bisa dianggap clean room implementation
    • Apakah LLM telah dilatih menggunakan kode chardet dapat menjadi faktor kunci dalam penilaian hukum
  • Pengguna lain berargumen bahwa “jika AI menghasilkan kode hanya berdasarkan input dan output, itu mungkin saja sah”
    • Namun, muncul sanggahan bahwa “kalau begitu, lisensi itu sendiri menjadi tidak bermakna”
  • Ketidakjelasan tanggung jawab hak cipta pada kode AI dan sulitnya memverifikasi kepatuhan lisensi muncul sebagai isu utama

Kompatibilitas lisensi dan diskusi GPL

  • Sebagian menyatakan bahwa lisensi MIT tidak kompatibel dengan GPL, tetapi pengguna lain mengutip dokumen resmi FSF untuk menjelaskan bahwa MIT (Expat) kompatibel dengan GPL
  • Namun, banyak yang sepakat bahwa “melakukan relicensing atas kode LGPL menjadi MIT tetap merupakan pelanggaran”
  • Pengguna lain juga menyoroti bahwa “tidak bisa mempertahankan reputasi dan repositori yang dibangun di atas kode LGPL sambil membuang kontrak lisensinya”

Data pelatihan AI dan persoalan kepercayaan

  • Sejumlah pengguna mempertanyakan apakah orang bisa benar-benar percaya bahwa Claude tidak dilatih dengan kode LGPL
    • Tidak bisa dilacaknya data pelatihan model AI disebut sebagai risiko hukum
  • Sebagian berpendapat bahwa jika kode AI mengandung kemungkinan plagiarisme, maka penggunaannya sendiri sebaiknya dihindari
    • Dengan mengutip riset, disebutkan statistik bahwa 2–5% kode AI mungkin merupakan salinan kode yang sudah ada

Identitas proyek dan kewenangan maintainer

  • Sebagian berargumen bahwa jika seluruh kode kontribusi sebelumnya telah dihapus, maka versi baru bisa dianggap independen
    • Namun, ada sanggahan bahwa tetap memakai nama dan reputasi yang sama adalah tidak tepat
  • Ada juga pendapat bahwa “hak cipta melindungi ekspresi, bukan nama”
  • Sebagian berpandangan bahwa jika maintainer benar-benar menghapus seluruh kode lama, maka mungkin tidak terjadi pelanggaran hukum, tetapi tidak ada bukti yang jelas yang diajukan

Pandangan menyeluruh komunitas

  • Sejumlah pengguna menyatakan hormat pada kontribusi Mark Pilgrim dan Dan Blanchard, sambil menekankan perlunya memahami kompleksitas isu AI, hak cipta, dan tata kelola open source
  • Diskusi berkembang ke tanggung jawab hukum kode hasil AI, keabsahan perubahan lisensi proyek, dan batas kewenangan maintainer open source
  • Sebagian bahkan mengusulkan, “mari fork v7.0.0 dan kembalikan ke LGPL”

Ringkasan isu utama

  • Legalitas perubahan LGPL → MIT: menurut banyak pihak, hal itu tidak mungkin dilakukan tanpa persetujuan penulis asli
  • Status hak cipta penulisan ulang oleh AI: bisa dianggap sebagai karya turunan tergantung pada paparan terhadap data pelatihan
  • Apakah ini clean room implementation: harus dibuktikan bahwa AI tidak merujuk pada kode asli
  • Masalah penggunaan nama dan reputasi proyek: redistribusi dengan nama yang sama menimbulkan kontroversi hukum dan etika
  • Keandalan kode AI: ada kekhawatiran soal risiko plagiarisme dan stabilitas rantai pasok

Isu ini dipandang sebagai contoh representatif soal hak cipta atas kode yang dihasilkan AI dan kepatuhan lisensi open source, dan berpotensi memengaruhi struktur tanggung jawab hukum alat pengembangan AI di masa depan.

1 komentar

 
GN⁺ 2026-03-06
Komentar Hacker News
  • Ada yang berpendapat Pilgrim salah memahami konsep hak cipta (clean room)
    Klaim “ditulis ulang sepenuhnya” tidak terlalu penting. Secara hukum, implementasi independen itu dimungkinkan.
    Clean room hanyalah perangkat prosedural untuk menyederhanakan gugatan, bukan syarat hukum bahwa seseorang tidak boleh pernah terpapar kode asli.
    Linux pun pada praktiknya mengetahui struktur internal Unix, tetapi tetap diimplementasikan secara independen

    • Terlepas dari tafsir hukum, ada kekhawatiran bahwa jika AI bisa otomatis menulis ulang kode GPL untuk mengakali lisensi, maka senjata komunitas open source akan hilang
    • Klaim bahwa uji kemiripan struktural bisa menentukan apakah sesuatu adalah karya turunan juga keliru. Menyimpulkan itu sebagai karya turunan hanya karena Claude digunakan juga salah. Standar hukum yang sebenarnya masih merupakan wilayah abu-abu
    • Ini perlu dipikirkan dalam tiga kasus.
      1. Jika kodenya mirip, maka perlu dibuktikan bahwa itu reimplementasi clean room
      2. Jika benar-benar berbeda, maka clean room tidak relevan
      3. Dalam kebanyakan kasus ada campuran bagian yang mirip dan tidak mirip, jadi tiap bagian perlu dianalisis. Jika ada bagian yang tersalin, maka bagian itu harus ditulis ulang
    • Fungsi chardet (deteksi encoding Unicode) pada dasarnya sudah tetap. Karena itu wajar jika implementasi baru lolos pengujian yang sama.
      Kemiripan rendah di JPlag tampak sebagai bukti yang cukup meyakinkan bahwa ini bukan plagiarisme
    • Ada yang merasa heran dengan anggapan bahwa kode hasil tulis ulang yang dihasilkan AI bisa menjadi objek perlindungan hak cipta
  • Klaim bahwa “kalau tahu codebase-nya maka penulisan ulang pun melanggar hak cipta” tidak sepenuhnya tepat
    Pengetahuan internal itu masuk ranah paten, bukan hak cipta.
    Namun, jika kode asli diletakkan di samping lalu hanya kalimatnya yang diubah, itu tetap pelanggaran.
    Jika AI melihat kode asli lalu menghasilkan kode yang mirip, besar kemungkinan itu dipandang sebagai penyalinan paralel.
    Tetapi jika ditulis sepenuhnya baru tanpa melihat aslinya, itu bisa saja sah. Hanya saja, secara hukum sulit dipertahankan sehingga dari sudut pandang perusahaan ini tetap harus dianggap risiko

    • Perbedaan antara paten dan hak cipta perlu diperjelas.
      Paten bisa dilanggar meskipun penemuan dilakukan secara independen, tetapi dalam hak cipta yang penting adalah independensi dalam penciptaan.
      Namun jika seseorang menghasilkan karya yang identik dengan karya yang sudah pernah ia lihat, akan sulit meyakinkan juri
      Pada akhirnya, jika ada kemiripan maka kemungkinan besar akan dinilai sebagai pelanggaran berdasarkan standar preponderance of evidence
    • Jika seseorang membaca The Godfather karya Mario Puzo lalu menulis novel dengan struktur yang sama, itu kemungkinan akan dianggap karya turunan.
      Sebaliknya, jika ia sama sekali tidak mengenal karya aslinya, itu bisa diakui sebagai ciptaan independen
    • Jika ada file Claude.md, besar kemungkinan maintainer baru memakai Claude sebagai generator kode, dan model itu kemungkinan telah dilatih dengan kode asli chardet
    • Muncul pertanyaan, “seberapa berbeda suatu kode agar bisa diakui sebagai kode baru?”
    • Penulisan ulang itu mirip dengan penerjemahan. Penerjemahan pun merupakan pelanggaran hak cipta.
      Ide itu sendiri tidak dilindungi, tetapi ekspresi dilindungi.
      Jika LLM pernah melihat kode asli dalam proses pelatihan, itu menjadi area abu-abu secara hukum
  • Intinya adalah apakah ada pelanggaran LGPL.
    Jika kode baru didasarkan pada kode asli, maka itu dianggap karya turunan dan LGPL harus tetap dipertahankan.
    Meski diklaim sebagai “penulisan ulang total”, jika ada paparan terhadap kode asli maka itu bisa menjadi pelanggaran lisensi

    • Namun, sekadar terpapar tidak otomatis menjadikannya karya turunan.
      Clean room hanyalah prosedur untuk pembelaan gugatan, dan beban pembuktian ada pada penggugat.
      Linux dan alat GNU juga mengetahui Unix tetapi tetap sah
    • Jika Claude memang dilatih dengan kode asli, maka menurut tafsir itu muncul kesimpulan menarik bahwa AI hanya bisa menghasilkan turunan LGPL
    • Hak cipta adalah inti persoalannya. Jika kode baru merupakan turunan dari yang asli, maka ia harus mengikuti LGPL; jika tidak, pemegang hak cipta baru bebas menentukan lisensinya
    • Jika nama yang sama tetap dipakai dan hanya versinya yang dinaikkan, itu pada dasarnya bisa terlihat sebagai proyek yang sama
  • Ada yang melihat kasus menarik saat konsultasi.
    Seorang engineer di perusahaan SaaS memakai Claude Code untuk merekayasa balik aplikasi perusahaannya sendiri dan membuat backend yang kompatibel dengan API hanya dalam seminggu.
    Lalu muncul pertanyaan, “kalau pesaing melakukan hal seperti ini, bagaimana cara melindunginya?”

    • Itu pada dasarnya hanyalah kemajuan teknologi.
      Jika kode itu sendiri adalah inti bisnis, maka sebenarnya sejak awal sudah berisiko.
      Daripada mengkhawatirkan persaingan, lebih penting membuat produk yang lebih baik
    • Seperti kasus StrongDM Factory, penyalinan layanan eksternal untuk dipakai dalam pengujian kini benar-benar terjadi.
      Sekarang kita hidup di masa ketika ucapan seperti “mari reimplementasi Slack atau Drive” sudah tidak lagi terdengar mustahil
    • Jika AI hanya melihat frontend lalu mereimplementasi backend, maka itu legal.
      API adalah antarmuka publik sehingga bukan objek perlindungan
    • Paten tidak bisa didaftarkan setelah fakta terjadi, dan hak cipta tidak melindungi ide.
      Seperti pada kasus reverse engineering IBM BIOS atau DOS, implementasi independen itu sah
  • Maintainer adalah trustee, bukan pemilik.
    Ia tidak boleh seenaknya mengubah lisensi yang diberikan oleh pencipta asli.
    Jika kodenya benar-benar baru, maka proyek harus dimulai dengan nama baru.
    Pernyataan seperti “bekukan saja versi lama” dianggap bertentangan dengan semangat komunitas

  • Dalam komentar tahun 2021, sudah disebutkan bahwa “chardet berbasis LGPL sehingga tidak bisa dilisensikan ulang”.
    Jika penulisan ulang itu dilakukan dengan mengetahui hal tersebut, maka itu adalah keputusan yang gegabah dan bentuk ketidakmenghormati pencipta asli

    • Sebaliknya, ada juga pendapat bahwa itu adalah pilihan yang benar untuk memaksimalkan pemanfaatan proyek tersebut
  • Jika AI menulis dalam keadaan sudah melihat kode asli, maka itu bukan implementasi clean room.
    Kalau ada dua tim AI, satu membuat spesifikasi dan satu lagi mengimplementasikan, apakah itu bisa diterima?
    Ini mengikuti preseden era IBM, tetapi jika modelnya sendiri sudah dilatih dengan karya asli, masalahnya tetap ada

    • Jika chardet termasuk dalam data pelatihan, maka dalam bentuk apa pun clean room tidak mungkin
    • Jika spesifikasi diekstrak lalu model lain menulis kode berdasarkan spesifikasi itu, secara teori clean room mungkin dilakukan.
      Namun, harus diverifikasi bahwa spesifikasi tersebut tidak mengandung elemen ekspresif
    • Jika karya asli ada dalam data pelatihan, kemungkinan pelanggaran tetap besar
    • Ada juga yang sempat berpendapat bahwa struktur API juga bagian dari hak cipta, tetapi kemudian dikoreksi
    • Kasus IBM/Compaq hanya tampak mirip di permukaan.
      Jika karya asli ada di data pelatihan, maka perbandingan itu sendiri menjadi tidak bermakna
  • Seperti lelucon “kalau menyalin-tempel Wikipedia lalu mengganti beberapa kata apakah itu aman?”,
    pada akhirnya penghindaran yang disengaja memang tidak mungkin berhasil.
    Kita hidup di masa ketika sulit untuk percaya sampai-sampai versi dependency harus dipatok

    • Para teknolog sering salah paham dan mengira hukum itu aturan teknis.
      Padahal hukum menekankan penilaian secara keseluruhan.
      Pengadilan menilai dengan standar “preponderance of evidence”, dan sekadar mengganti kata tidak otomatis menjadikannya karya baru.
      Jika karya asli itu esensial, besar kemungkinan akan dianggap karya turunan.
      Jika karya asli ada dalam data pelatihan, diperkirakan gugatan pelanggaran hak cipta akan sulit dihindari
  • Di sisi lain, menarik bahwa Mark Pilgrim muncul lagi
    Di halaman Wikipedia-nya ada kisah tentang dirinya yang “menghilang dari Internet”.
    Buku-buku Python karyanya masih layak direkomendasikan

    • Mungkin tak lama lagi akun GitHub “a2mark” juga akan disebut di Wikipedia
  • Ada yang heran, “kalau AI dilatih dengan kode GPL, bukankah berarti semua kode AI menjadi terkontaminasi GPL (taint)?”

    • Ada proyek seperti ReactOS yang menuntut clean room sepenuhnya, tetapi itu hanya langkah pengamanan hukum, bukan keharusan mutlak
    • Untuk membuktikan “kontaminasi”, tetap harus dibuktikan adanya sifat turunan secara nyata.
      Prosedur clean room di AS hanyalah strategi untuk mempersingkat litigasi
    • Ada pula pandangan bahwa sistem hak cipta pada dasarnya memang alat perlindungan modal, sehingga kecil kemungkinan ia benar-benar ditegakkan sekeras itu
    • Ada orang-orang yang sudah memperingatkan masalah ini sejak awal demam LLM