Atlassian mengubah pemanfaatan data pelanggan untuk pelatihan AI menjadi pengaturan default
(letsdatascience.com)- Metadata pelanggan dan konten dalam aplikasi dari produk Atlassian Cloud seperti Jira dan Confluence akan digunakan secara default untuk melatih Rovo dan Rovo Dev mulai 17 Agustus 2026
- Pengaturan default akan berbeda menurut paket, dan pada Free·Standard·Premium, kontribusi metadata selalu aktif, sementara hanya Enterprise yang mempertahankan nonaktif default serta kendali atas metadata dan data dalam aplikasi
- Cakupan data yang dikumpulkan mencakup metadata seperti skor keterbacaan, story point, dan nilai SLA, serta data dalam aplikasi seperti isi halaman, deskripsi issue, komentar, dan nama workflow
- Langkah perlindungan seperti penghapusan pengenal langsung dan agregasi diterapkan, tetapi data kontribusi dapat disimpan hingga 7 tahun; setelah penghapusan atau opt-out, data dalam aplikasi dihapus dalam 30 hari dan model yang dilatih akan dilatih ulang dalam 90 hari
- Pergeseran kebijakan ini menjauh dari posisi sebelumnya yang tidak menggunakan data, dan mengubah asal data untuk alat kerja serta tingkat kontrol berdasarkan harga, sehingga berdampak lebih luas pada penilaian privasi, tata kelola, dan kepatuhan
Ringkasan perubahan
- Atlassian akan mulai menggunakan metadata pelanggan dan konten dalam aplikasi dari Jira, Confluence, dan produk Atlassian Cloud lainnya secara default untuk pelatihan AI mulai 17 Agustus 2026
- Fitur AI yang disebut secara eksplisit adalah Rovo dan Rovo Dev
- Skala pelanggan yang terdampak sekitar 300 ribu pelanggan
- Perubahan kebijakan kontribusi data membuat pengaturan default dibedakan menurut paket
- Paket tingkat bawah tidak dapat melakukan opt-out dari pengumpulan metadata
- Paket Enterprise tetap memiliki kendali atas pengumpulan metadata dan data dalam aplikasi
- Data kontribusi yang dikumpulkan dapat disimpan hingga 7 tahun
- Setelah penghapusan atau opt-out, data dalam aplikasi akan dihapus dalam 30 hari
- Model yang dilatih menggunakan data tersebut akan dilatih ulang dalam 90 hari untuk menghapus kontribusinya
Detail teknis
- Atlassian membagi cakupan pengumpulan ke dalam dua kategori: metadata dan data dalam aplikasi
- Metadata mencakup sinyal yang telah dianonimkan
- Data dalam aplikasi mencakup konten yang dibuat pengguna
- Rincian item yang termasuk dalam kategori metadata
- Skor keterbacaan dan kompleksitas
- Klasifikasi pekerjaan
- Metrik kemiripan semantik
- Story point
- Tanggal akhir sprint
- Nilai SLA dari Jira Service Management
- Rincian item yang termasuk dalam kategori data dalam aplikasi
- Judul dan isi halaman Confluence
- Judul issue, deskripsi, dan komentar Jira
- Nama emoji kustom
- Nama status kustom
- Nama workflow
- Sebelum pelatihan, Atlassian menyatakan akan menerapkan penghapusan pengenal langsung, agregasi data, dan langkah perlindungan lainnya
Pengaturan default per paket dan pihak yang dikecualikan
- Pengaturan default ditentukan berdasarkan paket aktif tertinggi dalam organisasi
- Pelanggan Free dan Standard
-
Kontribusi metadata selalu aktif
- Tidak dapat opt-out dari pengumpulan metadata
- Kontribusi data dalam aplikasi aktif secara default, tetapi pengaturannya dapat diubah
- Pelanggan Premium
- Kontribusi metadata selalu aktif
- Kontribusi data dalam aplikasi nonaktif secara default
- Pelanggan Enterprise
- Metadata dan data dalam aplikasi keduanya nonaktif secara default
- Dapat melakukan opt-out untuk metadata
- Kelompok pelanggan yang secara eksplisit dikecualikan dari seluruh cakupan pengumpulan
- Pelanggan yang menggunakan customer-managed encryption keys
- Pelanggan yang menggunakan Atlassian Government Cloud
- Pelanggan yang menggunakan Atlassian Isolated Cloud
- Pelanggan yang memiliki kewajiban HIPAA
-
Konteks dan pentingnya
- Kebijakan ini bergerak berlawanan dengan posisi sebelumnya
- Sebelumnya Atlassian menyatakan tidak menggunakan data pelanggan untuk melatih atau meningkatkan layanan AI
- Arus industri yang disebut sebagai latar belakang perubahan
- Penyedia SaaS mengumpulkan sinyal penggunaan internal dan konten untuk bootstrap model, fine-tuning, dan evaluasi
- Pada saat yang sama mereka juga menjanjikan analisis berbasis anonimisasi dan agregasi
- Manfaat praktis yang disebutkan Atlassian
- Peningkatan relevansi pencarian
- Ringkasan yang lebih baik
- Saran template
- Optimasi workflow berbasis agen
- Dampaknya dari sudut pandang praktisi di lapangan
- Perubahan pada asal data model yang digunakan di alat kerja
- Perubahan tingkat kontrol data berdasarkan harga serta kriteria penilaian kepatuhan dan pengadaan
Risiko dan trade-off
- Pengumpulan metadata wajib bagi pelanggan non-Enterprise memicu kekhawatiran privasi dan tata kelola, terlepas dari apakah pengenal telah dihapus
- Telemetri seperti story point dan metrik SLA dapat mengungkap struktur proyek dan pola kinerja
- Penyimpanan 7 tahun untuk data yang dianonimkan memperluas permukaan paparan seiring waktu
- Menambah beban bagi pelanggan yang mewajibkan audit retensi data jangka panjang
- Ada jalur pengecualian bagi pelanggan berkeamanan tinggi dan pengguna customer-managed keys
- Namun, hal itu dapat menuntut perpindahan ke paket yang lebih mahal atau bentuk deployment khusus
Hal yang perlu diperhatikan
- Setiap organisasi perlu meninjau tenant Atlassian mereka
- Perlu memeriksa paket aktif tertinggi per tenant
- Perlu memahami pengaturan default kontribusi data
- Perlu memperbarui pengaturan administrasi selama periode rollout
- Jika membutuhkan opt-out penuh, perlu mempertimbangkan perpindahan ke Enterprise atau deployment terisolasi
- Poin pemantauan dari sisi produk
- Perlu melihat bagaimana Atlassian benar-benar menjalankan prosedur pelatihan ulang 90 hari
- Perlu memeriksa apakah pemasok LLM downstream yang digunakan di Rovo menyatakan tidak menyimpan input
- Jika pola ini menyebar ke SaaS enterprise secara lebih luas, ada kemungkinan muncul penolakan pelanggan dan pengawasan regulator
Dasar penilaian
- Perubahan ini memiliki dampak praktis bagi ribuan pengguna enterprise dan praktisi yang menangani tata kelola data serta manajemen asal model
- Ini tidak diposisikan sebagai model tercanggih atau tonggak regulasi
- Ini dinilai sebagai perubahan kebijakan produk yang secara nyata mengubah pipeline data tim dan pilihan kepatuhan
1 komentar
Komentar Hacker News
Saya merasa Atlassian hanya terus membuat kesalahan demi kesalahan. Saya masih sering memakai produknya, tetapi frekuensi saya menemui bug level P0 terlalu tinggi. self-hosted Bitbucket workers khususnya sudah sangat usang, terutama di sisi Docker, sampai-sampai kami harus menambalnya dengan banyak solusi sementara. Di JIRA, untuk mengubah urutan tiket baru saja sudah bertahun-tahun masih perlu refresh. Fitur-fitur baru yang ditambahkan ke JIRA dan Bitbucket dalam beberapa tahun terakhir juga sering tidak berjalan dengan baik. Saya juga sempat mencoba fitur AI lewat free trial, tetapi sama sekali tidak berfungsi, dan pembatalannya pun tidak bisa dilakukan secara online sehingga saya harus membuat beberapa tiket dukungan, sementara formulir dukungannya sendiri berkali-kali rusak. Saya jadi penasaran kenapa kerusakan fungsi bisa sampai separah ini, apakah karena utang teknis, eksodus talenta, atau keduanya. Kalau melihat komunitasnya, tampak ratusan sampai ribuan bug dengan berbagai workaround yang menempel
Saya ingin bisa menautkan sumber yang lebih baik, tetapi poin utamanya menurut saya adalah bahwa pelanggan gratis maupun berbayar saat ini secara default ikut serta memberikan data untuk pelatihan AI. Semua isi seperti halaman Confluence dan tiket Jira termasuk di dalamnya. Dokumen dukungan Atlassian memang menjelaskan cara mematikannya, tetapi di instance kami pengaturan itu sendiri tidak muncul
Saya melihat rumor bahwa Anthropic sedang membahas akuisisi Atlassian dan kemungkinan alasannya adalah data pelatihan. Bahkan sudah ada posting Reddit yang menyebut pergerakan data poisoning juga sudah mulai beredar
Saya merasa di enterprise SaaS, pola pengumpulan sebagai default alih-alih opt-out default makin dinormalisasi. Tetapi kasus ini sangat serius karena cakupannya bukan sekadar metadata, melainkan semua konten di dalam aplikasi, dan di atas itu pengaturan opt-out-nya sendiri bahkan tidak dirender. Keputusan kebijakannya sendiri mungkin masih bisa diperdebatkan, tetapi kalau dua hal itu digabung, jadinya terlihat seperti sengaja menciptakan friksi. Soal data residency juga perlu dipisahkan pembahasannya, karena banyak pembeli mengira penguncian wilayah berarti jaminan privasi penuh, padahal itu hanya berarti lokasi penyimpanan, bukan siapa yang bisa mengakses data dan untuk tujuan apa
Saya melihat banyak perusahaan lain seperti GitHub, Figma, Adobe, dan Vercel juga mengaktifkan hal seperti ini secara default. Jadi rasanya realistis untuk berasumsi bahwa kalau kita menitipkan data ke perusahaan mana pun, pada dasarnya mereka bisa memakainya untuk pelatihan model
Kalau rumor akuisisi Anthropic itu benar, saya pikir Atlassian akan terlihat sebagai peluang untuk membeli satu paket dataset bersinyal tinggi di sekitar pekerjaan bisnis
Saya penasaran apakah Atlassian juga menjadikan kode dan konten dari repositori private Bitbucket sebagai objek pengumpulan. Teks kebijakan dan FAQ-nya ambigu, jadi saya ingin jawaban yang jelas berupa ya atau tidak
Dulu ada ungkapan bahwa kalau kita tidak membayar maka kita adalah produknya, tetapi sekarang perusahaan bahkan membayar dan menjadikan dirinya sendiri produk, jadi terasa lebih absurd lagi
Saya ingin benar-benar menekankan bahwa opsi data residency Atlassian tidak mencegah masalah ini. Walaupun data diikat ke wilayah tertentu, data itu tetap bisa dipakai untuk tujuan pelatihan
Jadi saya merasa sekarang makin jelas kenapa Atlassian ingin mengurangi dukungan Data Center untuk on-prem