- GitHub berencana memanfaatkan kode dan data dari repositori pribadi untuk melatih model AI
- Pengguna harus secara eksplisit menolak (opt-out) sebelum 24 April agar penggunaan data diblokir
- Jika tidak menolak, informasi proyek privat dapat ikut masuk ke data pelatihan
- Kebijakan ini terkait dengan pengumpulan data untuk meningkatkan fitur AI seperti GitHub Copilot
- Developer perlu memeriksa pengaturan demi privasi data dan keamanan kode
Perubahan kebijakan data pelatihan AI GitHub
- GitHub mengubah kebijakan agar data repositori pribadi dapat dimasukkan ke pelatihan untuk peningkatan model AI
- Jika pengguna tidak menolak secara terpisah, data akan otomatis dimanfaatkan
- Penolakan dapat dilakukan langsung dari halaman pengaturan GitHub
- Data pelatihan berpotensi mencakup kode privat, metadata proyek, dan riwayat commit
- Langkah ini dijelaskan sebagai upaya untuk meningkatkan kualitas Copilot dan fitur AI lainnya
Dampaknya bagi developer
- Jika repositori pribadi digunakan untuk pelatihan, ada risiko tereksposnya kode sensitif atau logika internal
- Perusahaan maupun developer individu perlu meninjau kebijakan keamanan dan menjalankan prosedur opt-out
- Perubahan GitHub kali ini dapat memicu diskusi tentang transparansi data pelatihan AI dan kendali pengguna
3 komentar
Sejak beberapa hari lalu ini terus muncul di GitHub saya,
Important update
On April 24 we'll start using GitHub Copilot interaction data for AI model training unless you opt out. Review this update and manage your preferences in your GitHub account settings.
Saya sudah opt out, tapi rasanya mereka memang sudah memanfaatkannya untuk AI sejak dulu, bukan?
Ini jelas sekali berita palsu yang keterlaluan
Opini Hacker News
Sudah dibicarakan sejak 2023. Jika informasi yang tersimpan di database berada dalam bentuk yang bisa diakses bebas oleh perusahaan, pada akhirnya perusahaan itu akan mengubah ketentuan layanan agar bisa memakainya sebagai data pelatihan AI. Insentifnya terlalu kuat, jadi rasanya sulit dihindari
Ada yang bilang “tidak begitu” sambil membagikan tautan ke blog resmi GitHub. Pengguna Free, Pro, dan Pro+ Copilot akan memakai data penggunaan untuk pelatihan model jika tidak melakukan opt-out. Pengguna Business atau pelanggan Pro tidak termasuk dalam pelatihan. Jika tidak memakai Copilot, tidak ada dampaknya. Jika opt-out sekarang, pengaturannya akan tetap dipertahankan nanti
Judul berita ini berpotensi menyesatkan. GitHub bukan melatih langsung pada private repo itu sendiri, melainkan pada data interaksi yang muncul saat memakai Copilot. Kalau tidak memakai Copilot, tidak ada dampaknya. Meski begitu, tetap bagus kalau dimatikan
Tepatnya, opt-out ini adalah pengaturan untuk pelatihan Copilot. Sampai sekarang hanya public repo yang opt-in, tapi mulai 24 April private repo juga akan ikut secara default. Jika kamu memakai Copilot di private repo, sebaiknya opt-out di github.com/settings/copilot. Cuma 30 detik
Aku penasaran, kalau ada satu orang di tim yang tidak opt-out, apakah Copilot bisa mengakses seluruh repo. Aku juga ingin tahu apakah ada cara untuk memeriksa status pengaturan rekan tim
Saat ini pengaturannya hanya bisa dilakukan di tingkat pengguna. Aku ingin tahu apakah ada cara untuk menonaktifkannya sekaligus di seluruh organisasi. Aku khawatir kalau satu orang saja menyalakannya, kode organisasi dianggap sebagai data pelatihan
Aku akui GitHub memang terus menampilkan banner pemberitahuan. Tapi aku sendiri juga tidak membacanya sampai melihat posting HN ini
Private repo-ku isinya kode berantakan, jadi tidak perlu dikhawatirkan. Malah kalau LLM belajar dari kodenya, justru rugi sendiri
Kasihan orang-orang yang sudah lama bayar GitHub tapi tidak pernah melihat pengumuman ini