Atlassian mengubah pemanfaatan data pelanggan untuk pelatihan AI menjadi pengaturan default

(letsdatascience.com)

5 poin oleh GN⁺ 2026-04-21 | 1 komentar | Bagikan ke WhatsApp

Metadata pelanggan dan konten dalam aplikasi dari produk Atlassian Cloud seperti Jira dan Confluence akan digunakan secara default untuk melatih Rovo dan Rovo Dev mulai 17 Agustus 2026
Pengaturan default akan berbeda menurut paket, dan pada Free·Standard·Premium, kontribusi metadata selalu aktif, sementara hanya Enterprise yang mempertahankan nonaktif default serta kendali atas metadata dan data dalam aplikasi
Cakupan data yang dikumpulkan mencakup metadata seperti skor keterbacaan, story point, dan nilai SLA, serta data dalam aplikasi seperti isi halaman, deskripsi issue, komentar, dan nama workflow
Langkah perlindungan seperti penghapusan pengenal langsung dan agregasi diterapkan, tetapi data kontribusi dapat disimpan hingga 7 tahun; setelah penghapusan atau opt-out, data dalam aplikasi dihapus dalam 30 hari dan model yang dilatih akan dilatih ulang dalam 90 hari
Pergeseran kebijakan ini menjauh dari posisi sebelumnya yang tidak menggunakan data, dan mengubah asal data untuk alat kerja serta tingkat kontrol berdasarkan harga, sehingga berdampak lebih luas pada penilaian privasi, tata kelola, dan kepatuhan

Ringkasan perubahan

Atlassian akan mulai menggunakan metadata pelanggan dan konten dalam aplikasi dari Jira, Confluence, dan produk Atlassian Cloud lainnya secara default untuk pelatihan AI mulai 17 Agustus 2026
- Fitur AI yang disebut secara eksplisit adalah Rovo dan Rovo Dev
- Skala pelanggan yang terdampak sekitar 300 ribu pelanggan
Perubahan kebijakan kontribusi data membuat pengaturan default dibedakan menurut paket
- Paket tingkat bawah tidak dapat melakukan opt-out dari pengumpulan metadata
- Paket Enterprise tetap memiliki kendali atas pengumpulan metadata dan data dalam aplikasi
Data kontribusi yang dikumpulkan dapat disimpan hingga 7 tahun
- Setelah penghapusan atau opt-out, data dalam aplikasi akan dihapus dalam 30 hari
- Model yang dilatih menggunakan data tersebut akan dilatih ulang dalam 90 hari untuk menghapus kontribusinya

Detail teknis

Atlassian membagi cakupan pengumpulan ke dalam dua kategori: metadata dan data dalam aplikasi
- Metadata mencakup sinyal yang telah dianonimkan
- Data dalam aplikasi mencakup konten yang dibuat pengguna
Rincian item yang termasuk dalam kategori metadata
- Skor keterbacaan dan kompleksitas
- Klasifikasi pekerjaan
- Metrik kemiripan semantik
- Story point
- Tanggal akhir sprint
- Nilai SLA dari Jira Service Management
Rincian item yang termasuk dalam kategori data dalam aplikasi
- Judul dan isi halaman Confluence
- Judul issue, deskripsi, dan komentar Jira
- Nama emoji kustom
- Nama status kustom
- Nama workflow
Sebelum pelatihan, Atlassian menyatakan akan menerapkan penghapusan pengenal langsung, agregasi data, dan langkah perlindungan lainnya

Pengaturan default per paket dan pihak yang dikecualikan

Pengaturan default ditentukan berdasarkan paket aktif tertinggi dalam organisasi
Pelanggan Free dan Standard
- Kontribusi metadata selalu aktif
  - Tidak dapat opt-out dari pengumpulan metadata
  - Kontribusi data dalam aplikasi aktif secara default, tetapi pengaturannya dapat diubah
  - Pelanggan Premium
  - Kontribusi metadata selalu aktif
  - Kontribusi data dalam aplikasi nonaktif secara default
  - Pelanggan Enterprise
  - Metadata dan data dalam aplikasi keduanya nonaktif secara default
  - Dapat melakukan opt-out untuk metadata
  - Kelompok pelanggan yang secara eksplisit dikecualikan dari seluruh cakupan pengumpulan
  - Pelanggan yang menggunakan customer-managed encryption keys
  - Pelanggan yang menggunakan Atlassian Government Cloud
  - Pelanggan yang menggunakan Atlassian Isolated Cloud
  - Pelanggan yang memiliki kewajiban HIPAA

Konteks dan pentingnya

Kebijakan ini bergerak berlawanan dengan posisi sebelumnya
- Sebelumnya Atlassian menyatakan tidak menggunakan data pelanggan untuk melatih atau meningkatkan layanan AI
Arus industri yang disebut sebagai latar belakang perubahan
- Penyedia SaaS mengumpulkan sinyal penggunaan internal dan konten untuk bootstrap model, fine-tuning, dan evaluasi
- Pada saat yang sama mereka juga menjanjikan analisis berbasis anonimisasi dan agregasi
Manfaat praktis yang disebutkan Atlassian
- Peningkatan relevansi pencarian
- Ringkasan yang lebih baik
- Saran template
- Optimasi workflow berbasis agen
Dampaknya dari sudut pandang praktisi di lapangan
- Perubahan pada asal data model yang digunakan di alat kerja
- Perubahan tingkat kontrol data berdasarkan harga serta kriteria penilaian kepatuhan dan pengadaan

Risiko dan trade-off

Pengumpulan metadata wajib bagi pelanggan non-Enterprise memicu kekhawatiran privasi dan tata kelola, terlepas dari apakah pengenal telah dihapus
- Telemetri seperti story point dan metrik SLA dapat mengungkap struktur proyek dan pola kinerja
Penyimpanan 7 tahun untuk data yang dianonimkan memperluas permukaan paparan seiring waktu
- Menambah beban bagi pelanggan yang mewajibkan audit retensi data jangka panjang
Ada jalur pengecualian bagi pelanggan berkeamanan tinggi dan pengguna customer-managed keys
- Namun, hal itu dapat menuntut perpindahan ke paket yang lebih mahal atau bentuk deployment khusus

Hal yang perlu diperhatikan

Setiap organisasi perlu meninjau tenant Atlassian mereka
- Perlu memeriksa paket aktif tertinggi per tenant
- Perlu memahami pengaturan default kontribusi data
Perlu memperbarui pengaturan administrasi selama periode rollout
Jika membutuhkan opt-out penuh, perlu mempertimbangkan perpindahan ke Enterprise atau deployment terisolasi
Poin pemantauan dari sisi produk
- Perlu melihat bagaimana Atlassian benar-benar menjalankan prosedur pelatihan ulang 90 hari
- Perlu memeriksa apakah pemasok LLM downstream yang digunakan di Rovo menyatakan tidak menyimpan input
Jika pola ini menyebar ke SaaS enterprise secara lebih luas, ada kemungkinan muncul penolakan pelanggan dan pengawasan regulator

Dasar penilaian

Perubahan ini memiliki dampak praktis bagi ribuan pengguna enterprise dan praktisi yang menangani tata kelola data serta manajemen asal model
Ini tidak diposisikan sebagai model tercanggih atau tonggak regulasi
Ini dinilai sebagai perubahan kebijakan produk yang secara nyata mengubah pipeline data tim dan pilihan kepatuhan

1 komentar

GN⁺ 2026-04-21

Komentar Hacker News

Saya merasa Atlassian hanya terus membuat kesalahan demi kesalahan. Saya masih sering memakai produknya, tetapi frekuensi saya menemui bug level P0 terlalu tinggi. self-hosted Bitbucket workers khususnya sudah sangat usang, terutama di sisi Docker, sampai-sampai kami harus menambalnya dengan banyak solusi sementara. Di JIRA, untuk mengubah urutan tiket baru saja sudah bertahun-tahun masih perlu refresh. Fitur-fitur baru yang ditambahkan ke JIRA dan Bitbucket dalam beberapa tahun terakhir juga sering tidak berjalan dengan baik. Saya juga sempat mencoba fitur AI lewat free trial, tetapi sama sekali tidak berfungsi, dan pembatalannya pun tidak bisa dilakukan secara online sehingga saya harus membuat beberapa tiket dukungan, sementara formulir dukungannya sendiri berkali-kali rusak. Saya jadi penasaran kenapa kerusakan fungsi bisa sampai separah ini, apakah karena utang teknis, eksodus talenta, atau keduanya. Kalau melihat komunitasnya, tampak ratusan sampai ribuan bug dengan berbagai workaround yang menempel
- Menurut saya, pembatalan free trial yang diblokir secara online itu tidak bisa dijelaskan selain sebagai penipuan terhadap pelanggan. Hal seperti ini rasanya juga sangat mudah dicegah lewat hukum, tetapi tampaknya pemerintah tidak tertarik. Atlassian terlihat seperti perusahaan besar tipikal yang menjual ke atasan para penggunanya, bukan ke penggunanya sendiri. Begitu melewati skala tertentu dan tekanan untuk bersaing lewat kualitas melemah, saya merasa korupsi internal dan ketidakmampuan mudah menyebar
- Sebagai orang yang pernah bekerja di sana, menurut saya jawabannya adalah gabungan dari kurangnya kapabilitas engineering, prioritas yang tercerai-berai, dan restrukturisasi organisasi yang tidak bermakna. Bitbucket pipelines dan workers pada dasarnya awalnya dibuat oleh dua orang, dan kemungkinan hanya sekitar satu orang yang benar-benar aktif memeliharanya selama 10 tahun terakhir. Jika belum lama ini memang ada PHK, mungkin kondisinya jadi lebih parah. Kantornya sekarang bahkan sudah tidak ada secara fisik, dan orang-orang dari masa itu juga semuanya sudah pergi
- Menurut saya penyebabnya dalam satu kata adalah Featureitis. Caranya ya terus mendorong fitur tanpa pikir panjang. Sekarang bahkan tampaknya ada kemungkinan kode buatan AI ikut ditumpuk di atasnya. Di proyek skala menengah pun, kalau yang didorong terus hanya fitur baru, hasilnya bisa mirip begini, dan beberapa proyek yang pernah saya alami juga berakhir di jalur yang sama karena yang penting cuma centang fitur dari backlog raksasa
- Saya merasa fitur pencarian Jira memang selalu berada di level yang nyaris tidak bisa dipakai. Itu mungkin bagian terburuk dari seluruh platform, tetapi melihat mereka masih fokus menambah fitur-fitur yang jelas tidak akan pernah saya pakai rasanya membuat putus asa
- Saya merasa Jira belakangan ini terlalu tidak stabil karena sinkronisasi yang kacau. Di sprint board, modal tiket menutup sendiri sehingga saya harus terus membukanya lagi, dan belum lama ini ada tiket yang sama sekali tidak mau muncul di board itu apa pun yang saya lakukan, lalu belakangan epic-nya tiba-tiba muncul dan setelah itu tiket individualnya juga muncul lagi. Kalau ini yang disebut nilai tambah vibe coding bagi dunia, rasanya menyedihkan
Saya ingin bisa menautkan sumber yang lebih baik, tetapi poin utamanya menurut saya adalah bahwa pelanggan gratis maupun berbayar saat ini secara default ikut serta memberikan data untuk pelatihan AI. Semua isi seperti halaman Confluence dan tiket Jira termasuk di dalamnya. Dokumen dukungan Atlassian memang menjelaskan cara mematikannya, tetapi di instance kami pengaturan itu sendiri tidak muncul
- Dari pemberitahuan yang saya terima lewat email, pemahaman saya adalah bahwa pengaturan opt-out akan diluncurkan bertahap di Admin portal mulai Mei. Itu lebih dulu berlaku untuk Jira, Confluence, Jira Service Management, dan aplikasi Atlassian Platform, lalu akan muncul secara bertahap di Atlassian Administration hingga 19 Mei 2026, dan mereka akan memberi tahu lagi sebelum 17 Agustus 2026
- Saya sudah membongkar Atlassian Administration > Security dan berbagai halaman pengaturan lain, tetapi sama sekali tidak menemukan item Data contribution. Kalau begitu, apakah artinya saat ini orang otomatis opt-in tetapi pada praktiknya belum ada cara untuk opt-out?
- Saya terkejut melihat cakupan yang tertulis di FAQ. Disebut sebagai konten buatan pengguna, tetapi itu berarti judul dan isi Confluence, judul issue dan deskripsi Jira, komentar, nama emoji kustom, nama status kustom, sampai nama workflow juga ikut tercakup, jadi ruang lingkupnya terlalu luas
- Saya khawatir apakah bahkan informasi sensitif seperti data pelanggan, tiket privat, isi perbaikan CVE yang masih embargo, atau informasi kesehatan sensitif bisa ikut tercampur untuk melatih model lalu bocor kemudian ke orang yang sama sekali tidak berhak
- Untuk penjelasan resmi mengenai perubahan ini, menurut saya yang paling langsung adalah merujuk ke FAQ Atlassian
Saya melihat rumor bahwa Anthropic sedang membahas akuisisi Atlassian dan kemungkinan alasannya adalah data pelatihan. Bahkan sudah ada posting Reddit yang menyebut pergerakan data poisoning juga sudah mulai beredar
- Kalau itu benar, saya tahu setidaknya ada dua perusahaan yang tidak akan bisa lagi memakai produk Atlassian. Itu akan dibaca sebagai sinyal bahwa mereka terlalu meremehkan privasi dan tuntutan regulasi
- Dulu kalau source code dari tempat seperti GitHub di-scrape lalu AI menghasilkan kode dari sana, sekarang rasanya kita masuk ke tahap di mana dokumen spesifikasi dari tempat seperti Atlassian yang di-scrape lalu AI menghasilkannya kembali. Lalu sumber berikutnya apa, saya jadi membayangkan dengan getir apakah sampai pernyataan misi perusahaan atau slogan cari uang pun nanti ikut jadi sasaran
- Kalau harga sahamnya terus turun, saya rasa akuisisi seperti itu memang bisa saja benar-benar terjadi
Saya merasa di enterprise SaaS, pola pengumpulan sebagai default alih-alih opt-out default makin dinormalisasi. Tetapi kasus ini sangat serius karena cakupannya bukan sekadar metadata, melainkan semua konten di dalam aplikasi, dan di atas itu pengaturan opt-out-nya sendiri bahkan tidak dirender. Keputusan kebijakannya sendiri mungkin masih bisa diperdebatkan, tetapi kalau dua hal itu digabung, jadinya terlihat seperti sengaja menciptakan friksi. Soal data residency juga perlu dipisahkan pembahasannya, karena banyak pembeli mengira penguncian wilayah berarti jaminan privasi penuh, padahal itu hanya berarti lokasi penyimpanan, bukan siapa yang bisa mengakses data dan untuk tujuan apa
- Saya khususnya merasa frasa di artikel The Register yang menyatakan bahwa bahkan jika kontrak dihentikan sekarang, pengaturan data contribution yang baru tetap baru berlaku pada 17 Agustus 2026 terdengar lebih licik lagi. Artinya, struktur ini pada praktiknya bahkan tidak memberi waktu untuk meninjau pilihan lain
Saya melihat banyak perusahaan lain seperti GitHub, Figma, Adobe, dan Vercel juga mengaktifkan hal seperti ini secara default. Jadi rasanya realistis untuk berasumsi bahwa kalau kita menitipkan data ke perusahaan mana pun, pada dasarnya mereka bisa memakainya untuk pelatihan model
- Mungkin tahun ini akan menjadi tahun self-hosted. Untuk hal-hal seperti blog publik yang privasinya tidak terlalu penting, saya masih menaruhnya di cloud, tetapi untuk data yang tidak ingin saya pakai untuk pelatihan model atau penjualan iklan, saya sudah memindahkannya agar di-host langsung di jaringan saya sendiri
Kalau rumor akuisisi Anthropic itu benar, saya pikir Atlassian akan terlihat sebagai peluang untuk membeli satu paket dataset bersinyal tinggi di sekitar pekerjaan bisnis
- Kadang saya malah membayangkan dengan sindiran bahwa mungkin masalahnya akan selesai selamanya kalau Broadcom membeli Atlassian lalu memperlakukannya seperti VMware
- Saya tidak menganggap data di dalam Atlassian sebagai dataset yang bersih atau alami. Rasanya lebih seperti ruang dengan desain dari neraka yang menelan pekerjaan developer sungguhan ke dalam segala macam noise
- Kalau rumor seperti ini masih sekadar spekulasi forum, saya tidak akan mempercayainya sampai ada sumber tepercaya yang muncul. Kedengarannya juga seperti cerita untuk mengerek saham lalu membuangnya
Saya penasaran apakah Atlassian juga menjadikan kode dan konten dari repositori private Bitbucket sebagai objek pengumpulan. Teks kebijakan dan FAQ-nya ambigu, jadi saya ingin jawaban yang jelas berupa ya atau tidak
- Waktu saya mencarinya beberapa bulan lalu, saya menafsirkan bahwa mereka tidak melatih AI dengan kode repo privat, tetapi setelah pengumuman kali ini, saya tetap berniat memindahkannya ke server saya sendiri. Penyimpanan cloud memang nyaman, tetapi terus khawatir suatu hari ada orang datang lalu mengambil data saya seolah itu milik mereka sendiri rasanya tidak layak ditoleransi
- Kalau redaksinya ambigu, menurut saya itu pada dasarnya berarti jawabannya sudah jelas
Dulu ada ungkapan bahwa kalau kita tidak membayar maka kita adalah produknya, tetapi sekarang perusahaan bahkan membayar dan menjadikan dirinya sendiri produk, jadi terasa lebih absurd lagi
Saya ingin benar-benar menekankan bahwa opsi data residency Atlassian tidak mencegah masalah ini. Walaupun data diikat ke wilayah tertentu, data itu tetap bisa dipakai untuk tujuan pelatihan
Jadi saya merasa sekarang makin jelas kenapa Atlassian ingin mengurangi dukungan Data Center untuk on-prem

Atlassian mengubah pemanfaatan data pelanggan untuk pelatihan AI menjadi pengaturan default

Ringkasan perubahan

Detail teknis

Pengaturan default per paket dan pihak yang dikecualikan

Kontribusi metadata selalu aktif

Konteks dan pentingnya

Risiko dan trade-off

Hal yang perlu diperhatikan

Dasar penilaian

Bacaan terkait

1 komentar

Komentar Hacker News