Histomat F/OSS: Kita tidak boleh menolak LLM, melainkan merebutnya kembali

(writings.hongminhee.org)

14 poin oleh hongminhee 2026-01-17 | 1 komentar | Bagikan ke WhatsApp

Bukan memblokir F/OSS dari pelatihan LLM, melainkan membebaskan model hasil pelatihannya

Tulisan terbaru 〈Tentang FLOSS dan pelatihan LLM〉 (On FLOSS and training LLMs) dengan baik menggambarkan frustrasi komunitas F/OSS — ketidaksopanan perusahaan AI, keterbatasan hukum, dan sebagainya
Namun strategi mundur yang diusulkan penulis, seperti memblokir crawler, keluar dari GitHub, dan mengucilkan pengguna alat AI, justru melewatkan peluang penting

Masalahnya bukan pelatihan, melainkan enclosure

Masalah yang sebenarnya: bukan sekadar melatih LLM dengan kode kita, melainkan hasilnya diprivatisasi sebagai model proprietari
Ini bukan masalah baru — inilah masalah yang selama ini diperjuangkan F/OSS
- privatisasi commons
- monopoli atas pengetahuan kolektif
- aliran nilai satu arah dari banyak orang ke segelintir pihak

Pola historis GPL: teknologi baru → eksploitasi baru → lisensi baru

Lisensi F/OSS terus berevolusi mengikuti perubahan teknologi:

GPLv2 (1991) — mencegah distribusi yang hanya berupa biner → mewajibkan pembukaan source code
GPLv3 (2007) — mencegah Tivoization (penguncian hardware) → juga mewajibkan informasi instalasi
AGPL (2007) — menutup celah SaaS → penyediaan melalui jaringan juga dianggap distribusi

Sekarang? Muncul celah pelatihan:

perusahaan memakai kode F/OSS sebagai data pelatihan untuk model proprietari
tetapi tidak wajib membuka model ataupun mengungkap sumber pelatihannya
ini adalah bentuk eksploitasi yang sangat khas — ekstraksi nilai tanpa resiprositas

Solusinya: copyleft pelatihan seperti GPLv4 atau TGPL (Training GPL)

Syarat yang diusulkan:

pelatihan secara eksplisit diizinkan (selaras dengan prinsip kebebasan F/OSS)
tetapi model hasilnya harus dibebaskan — bobot harus dibuka dengan lisensi copyleft yang kompatibel
wajib mendokumentasikan data pelatihan
model yang di-fine-tune juga mewarisi kewajiban yang sama
penggunaan melalui jaringan (penyediaan API) juga dianggap distribusi

→ sebagaimana GPLv3 mewajibkan source code untuk biner, copyleft pelatihan akan mewajibkan bobot model untuk sistem yang telah dilatih

Mengapa ini lebih penting daripada mundur

Masalah strategi mundur:

Menyerahkan medan tempur — OpenAI/Anthropic sudah lebih dulu mengeruk semua yang mereka butuhkan. Yang justru terhalang oleh strategi mundur hanyalah LLM open source seperti Llama/Mistral
Salah mengidentifikasi masalah — masalahnya bukan teknologinya sendiri, melainkan siapa yang memakainya dan bagaimana cara memakainya
Memecah komunitas — mengucilkan pengguna “alat yang tidak etis”? Batas penggunaannya sampai mana? Ujian kemurnian seperti ini hanya efektif untuk memecah gerakan
Meninggalkan strategi inti F/OSS — kejeniusannya GPL adalah bukan melarang penggunaan, melainkan mewajibkan kebebasan diwariskan. Mundur adalah filsafat yang sepenuhnya berlawanan

Perbedaan cara membaca realitas

antirez (pencipta Redis): LLM tidak bisa dibalikkan → beradaptasi dan percayakan pada persaingan pasar
penulis artikel asli: perlawanan tetap bermakna → mundur dan blokir akses
artikel ini: LLM tidak bisa dibalikkan → tetapi siapa yang memilikinya adalah inti masalah

Pertanyaannya bukan apakah kita akan memakai LLM, melainkan:

siapa yang memiliki model?
siapa yang memperoleh manfaat dari commons yang dipakai untuk melatih model?
apakah hasil kontribusi jutaan pengembang F/OSS harus menjadi milik eksklusif segelintir pihak?

→ ini adalah soal apakah buah kerja kolektif tetap tinggal dalam kolektif, atau berubah menjadi properti privat

Sekarang adalah peluang historis

saat ini sedang berlangsung perbincangan tentang norma yang akan mengatur pelatihan AI dan keterbukaan model
diskusi komunitas sedang memanas
di tengah bertambahnya model AI open source, lisensi apa yang akan diterapkan masih belum ditentukan

Jika pengembang F/OSS mundur: lima tahun lagi perusahaan dan pengadilan yang ramah perusahaan akan menetapkan semua norma → celah pelatihan menjadi baku → AI open source akan dirugikan secara permanen

Jika kita ikut terlibat: dorong copyleft pelatihan → buka kode dengan lisensi yang menuntut pembebasan model → kita membentuk masa depan

Kesimpulan dalam satu kalimat

Bukan memblokir crawler, melainkan mengubah aturan tentang crawling. Bukan menolak LLM, melainkan merebutnya kembali.

→ Sudut pandang materialisme historis: daya produktif baru (LLM) menuntut relasi produksi baru (copyleft pelatihan)
→ Seperti saat Linus merilis Linux dengan GPL dan bukannya berkata “perusahaan tidak boleh memakainya”, melainkan “siapa pun boleh memakainya, tetapi jika ada perbaikan maka bagikanlah”
→ Demi masa depan di mana, sebagaimana kode adalah milik semua orang, model AI yang dilatih darinya juga menjadi milik semua orang

1 komentar

roxie 2026-01-23

Saya setuju dengan isi tulisannya. Namun, ketika ditanya dari mana, apa, dan sejauh mana kita harus berjuang, rasanya buntu.