10 poin oleh GN⁺ 2024-10-28 | 2 komentar | Bagikan ke WhatsApp
  • CEO Facebook Mark Zuckerberg mengklaim bahwa model bahasa besar Meta, Llama 3, adalah open source, tetapi kenyataannya bukan open source
  • Menurut definisi open source dari Open Source Initiative (OSI), lisensi Llama 3 tidak memenuhi syarat open source dalam beberapa hal
  • Meta bukan satu-satunya perusahaan yang memakai tipu daya ini. Praktik ini disebut "open washing"
    • Open washing adalah praktik menyesatkan yang mengemas produk atau layanan yang sebenarnya tidak terbuka seolah-olah "terbuka"
    • Istilah ini diciptakan pada 2009 oleh peneliti kebijakan internet Michelle Thorne, terinspirasi dari "greenwashing"
  • Di bidang AI, open washing sudah sangat meluas. Dari 45 model yang diteliti oleh para peneliti Radboud University, model dari perusahaan besar seperti Google, Meta, dan Microsoft ternyata bukan benar-benar open source

Mengapa perusahaan melakukan open washing

  • Dulu perusahaan enggan pada open source, tetapi sekarang persepsi terhadap open source telah berubah menjadi positif
    • Pada 2001, Steve Ballmer menyatakan bahwa "Linux adalah kanker", sambil berargumen bahwa jika memakai perangkat lunak open source maka seluruh perangkat lunak lainnya juga harus dijadikan open source
  • Perusahaan memanfaatkan citra positif open source, tetapi pada kenyataannya tidak benar-benar berkomitmen pada open source
    • Ini membantu memperbaiki citra publik dan menarik konsumen yang menghargai transparansi dan keterbukaan
    • Beberapa perusahaan lewat open washing melindungi model dan praktik mereka dari pengawasan ilmiah dan regulasi, sambil tetap menikmati manfaat dari label "open"
    • Karena AI Act Uni Eropa memberikan pengecualian khusus bagi model "open source", hal ini menjadi motivasi kuat untuk melakukan open washing

Tidak adanya definisi yang jelas tentang open source AI

  • Uni Eropa masih belum mampu menetapkan definisi yang jelas tentang open source AI, dan sebenarnya belum ada pihak mana pun yang benar-benar bisa melakukannya saat ini
    • OSI dijadwalkan mengumumkan definisi open source AI dalam beberapa hari ke depan
    • Lisensi open washing yang ada saat ini tidak sesuai dengan definisi siapa pun selain pembuatnya
  • Namun, tidak semua perusahaan AI besar berbohong soal open source
    • Sebagai contoh, Granite 3.0 LLM milik IBM benar-benar dirilis sebagai open source di bawah lisensi Apache 2
  • Meski OSI bukan pemerintah atau regulator, mengapa penggunaan istilah open source secara benar tetap penting?
    • OSI hanyalah organisasi nirlaba yang membuat pedoman berguna
  • Dan Lorenc, CEO Chainguard, mengatakan hal berikut dalam keynote di konferensi SOSS yang baru-baru ini digelar di Atlanta
    • Tidak ada yang bisa memaksa orang memakai definisi OSI, tetapi banyak orang, terutama pengacara, memercayai definisi itu
    • Mereka memercayai kerja OSI dan memahami perlindungan yang didapat perusahaan ketika memakai lisensi yang memenuhi standar open source
    • Itulah sebabnya definisi ini muncul dalam kontrak pengadaan perusahaan besar di seluruh dunia

Open source bukan sekadar persoalan hukum dan bisnis

  • Open source memberi pengembang cara bekerja yang lebih bebas
    • Tanpa open source, kita akan kehilangan manfaat dapat memakai kode secara bebas tanpa harus mengetahui atau mempedulikan berbagai syarat lisensi
    • Jika setiap lisensi kode harus diperiksa satu per satu, pengembang harus menjalani tinjauan hukum setiap kali ingin memakai library baru
    • Perusahaan akan takut memublikasikan sesuatu di internet jika tanggung jawab yang mereka hadapi saat source code dibuka tidak jelas
  • Lorenc menekankan bahwa ini bukan masalah perusahaan besar saja, melainkan masalah bersama
    • Semua orang yang memakai open source akan terdampak
    • Seluruh proyek bisa berhenti berfungsi, bug keamanan tidak akan diperbaiki, dan pemeliharaan akan menjadi jauh lebih sulit
    • Kita harus bertindak bersama untuk menjaga dan mempertahankan definisi open source. Jika tidak, para pengacara akan kembali campur tangan
  • Banyak pengacara hak kekayaan intelektual tidak menginginkan kerumitan seperti ini
    • Lisensi open source yang asli membuat hidup perusahaan, programmer, dan pengacara menjadi lebih mudah
    • Memperkenalkan klausul seperti "terbuka kecuali bagi mereka yang bisa bersaing dengan kami" atau "terbuka kecuali bagi mereka yang bisa men-deploy kode ke cloud" hanya akan mengundang masalah

Open washing merugikan semua orang

  • Pada akhirnya, open washing akan mengotori pekerjaan hukum, bisnis, dan pengembangan milik semua orang
  • Ironisnya, bahkan perusahaan berpandangan pendek yang saat ini mendukung pendekatan ini juga akan dirugikan
  • Sebab pada akhirnya, hampir seluruh pekerjaan mereka, terutama di bidang AI, dibangun di atas open source

Opini GN⁺

  • Praktik open washing yang merusak definisi open source dapat berdampak negatif bukan hanya pada bidang AI, tetapi juga pada industri perangkat lunak secara keseluruhan. Ini membatasi aktivitas pengembang dan meningkatkan risiko hukum bagi perusahaan
  • Sikap perusahaan yang hanya ingin memanfaatkan citra positif open source adalah pandangan jangka pendek. Dalam jangka panjang, hal itu justru bisa merugikan perusahaan itu sendiri
  • Untuk kemajuan teknologi AI, kolaborasi dan berbagi yang berlandaskan semangat open source sangatlah penting. Perusahaan harus memimpin dalam membangun budaya open source yang sejati
  • Penetapan definisi dan standar yang jelas untuk open source AI sangat mendesak. Definisi open source AI dari OSI dijadwalkan segera diumumkan, dan berdasarkan itu perusahaan, pemerintah, serta komunitas pengembang perlu bekerja sama
  • Kegiatan peningkatan kesadaran bagi konsumen dan pengembang untuk mencegah open washing juga diperlukan. Penting untuk tidak langsung menerima klaim "open" dari perusahaan, tetapi meneliti lisensi dan praktik sebenarnya dengan cermat

2 komentar

 
ndrgrd 2024-10-28

Fenomena ketika perusahaan merilis proyek sebagai open source untuk menyerahkan perbaikan bug awal dan peningkatan fitur kepada komunitas, lalu setelah stabil diam-diam menariknya kembali ke lisensi proprietari, tampaknya sering terlihat.

Memang ada pendapat bahwa orang bisa saja melakukan fork, tetapi pada akhirnya perusahaanlah yang begitu saja mengambil citra dan nilai nama yang sudah telanjur mapan.

 
GN⁺ 2024-10-28
Opini Hacker News
  • Saat memilih salah satu dari dua program atau model AI, muncul perdebatan antara orang yang lebih memilih open source dan yang tidak. Tujuannya adalah membuat program yang bukan open source tetap tampak seperti open source.

  • Open source adalah kompromi yang ramah bagi perusahaan, tetapi sebagian pesertanya memiliki moralitas yang tinggi. Orang-orang dengan moralitas ini harus mencegah penyalahgunaan open source.

  • Jika hal ini tidak bisa diselesaikan melalui merek dagang, sertifikasi, lisensi, dan semacamnya, pesannya harus disampaikan lewat media arus utama. <i>The Register</i> punya pengetahuan internal, tetapi hal ini perlu diketahui luas oleh publik.

  • Banyak perusahaan mencela open source sambil menjalankan bisnis mereka dengan bergantung pada perangkat lunak open source seperti Linux, Java, dan Debian. Sebagian besar perusahaan tidak merasa punya kewajiban untuk berkontribusi atau memberi dukungan.

  • OSI sedang menyiapkan definisi open source AI yang kontroversial.

  • thirdweb secara teknis adalah open source, tetapi tidak berfungsi tanpa API key, dan membatasi panggilan API ke SAAS. Ini membuat tim yang ingin membangun alternatif open source yang sesungguhnya menjadi patah semangat.

  • Akibat gagal memopulerkan konsep seperti fair source, perusahaan kecil non-SaaS tidak bisa bertahan hidup dengan open source.

  • Open source tidak memiliki etika atau filosofi yang dimiliki free software. Free software lebih unggul daripada open source.

  • Untuk model besar, biaya pelatihan tinggi, artefak biner bernilai tinggi, dan bisa dimodifikasi. Jika OSI menetapkan definisi, upaya mereka patut dipuji terlepas dari apakah Meta akan mengikutinya atau tidak.

  • OSI perlu menyadari bahwa di era penyedia cloud besar, dibutuhkan perlindungan dari para pelaku pasar. Diperlukan opsi lisensi yang jelas agar drama seperti Mongo, Elastic, dan Redis bisa dihindari.

  • Istilah "Open <something>" harus dilindungi agar tidak menyesatkan publik. Kebingungan seperti "OpenAI" harus dicegah.

  • Dibanding sekadar menyalahgunakan istilah "Open Source", yang lebih buruk adalah menerima kontribusi komunitas lalu mencabut lisensinya. Ini harus dianggap sebagai penipuan dan menimbulkan tanggung jawab perdata.

  • Untuk model AI, jika skrip pelatihan dan data yang dapat direproduksi tidak dibagikan, nama "Open Weights" lebih tepat.