- Metadata pelanggan dan konten dalam aplikasi dari produk Atlassian Cloud seperti Jira dan Confluence akan digunakan secara default untuk pelatihan Rovo dan Rovo Dev mulai 17 Agustus 2026
- Nilai default diterapkan berbeda menurut paket, dan pada Free, Standard, serta Premium, kontribusi metadata selalu aktif, sementara hanya Enterprise yang mempertahankan kondisi default nonaktif untuk metadata dan data dalam aplikasi serta hak kontrol penuh
- Cakupan pengumpulan mencakup metadata seperti skor keterbacaan, story point, nilai SLA, serta data dalam aplikasi seperti isi halaman, deskripsi issue, komentar, dan nama workflow
- Langkah perlindungan seperti penghapusan pengenal langsung dan agregasi diterapkan, tetapi data kontribusi disimpan hingga 7 tahun; setelah penghapusan atau opt-out, data dalam aplikasi dihapus dalam 30 hari dan model yang dilatih akan dilatih ulang dalam 90 hari
- Pergeseran kebijakan ini mengubah posisi sebelumnya yang tidak menggunakan data untuk pelatihan, sekaligus mengubah asal data alat kerja dan tingkat kontrol menurut harga paket, sehingga memperluas dampaknya pada penilaian privasi, tata kelola, dan kepatuhan
Ringkasan perubahan
- Atlassian akan menggunakan secara default metadata pelanggan dan konten dalam aplikasi dari Jira, Confluence, dan produk Atlassian Cloud lainnya untuk pelatihan AI mulai 17 Agustus 2026
- Fitur AI yang disebutkan secara spesifik adalah Rovo dan Rovo Dev
- Skala dampak sekitar 300 ribu pelanggan
- Perubahan kebijakan kontribusi data membuat nilai default berbeda menurut paket
- Paket tingkat bawah tidak bisa melakukan opt-out dari pengumpulan metadata
- Paket Enterprise tetap memiliki kontrol atas pengumpulan metadata dan data dalam aplikasi
- Masa simpan data kontribusi yang dikumpulkan hingga 7 tahun
- Setelah penghapusan atau opt-out, data dalam aplikasi akan dihapus dalam 30 hari
- Model yang dilatih menggunakan data tersebut akan dilatih ulang dalam 90 hari untuk menghapus kontribusinya
Detail teknis
- Atlassian membagi cakupan pengumpulan ke dalam dua kategori: metadata dan data dalam aplikasi
- Metadata mencakup sinyal yang telah dianonimkan
- Data dalam aplikasi mencakup konten buatan pengguna
- Item yang termasuk dalam kategori metadata diperinci sebagai berikut
- Skor keterbacaan dan kompleksitas
- Klasifikasi pekerjaan
- Indikator kemiripan semantik
- Story point
- Tanggal akhir sprint
- Nilai SLA di Jira Service Management
- Item yang termasuk dalam kategori data dalam aplikasi diperinci sebagai berikut
- Judul dan isi halaman di Confluence
- Judul issue, deskripsi, dan komentar di Jira
- Nama emoji kustom
- Nama status kustom
- Nama workflow
- Sebagai proses sebelum pelatihan, Atlassian menyebutkan penerapan penghapusan pengenal langsung, agregasi data, dan langkah perlindungan lainnya
Pengaturan default per paket dan pihak yang dikecualikan
- Pengaturan default ditentukan berdasarkan paket aktif tertinggi dalam organisasi
- Pelanggan Free dan Standard
-
Kontribusi metadata selalu aktif
- Tidak bisa melakukan opt-out dari pengumpulan metadata
- Kontribusi data dalam aplikasi aktif secara default, tetapi pengaturannya bisa diubah
- Pelanggan Premium
- Kontribusi metadata selalu aktif
- Kontribusi data dalam aplikasi nonaktif secara default
- Pelanggan Enterprise
- Metadata dan data dalam aplikasi sama-sama nonaktif secara default
- Opt-out metadata dimungkinkan
- Kelompok pelanggan yang dikecualikan dari seluruh cakupan pengumpulan juga disebutkan
- Pelanggan yang menggunakan customer-managed encryption keys
- Pelanggan Atlassian Government Cloud
- Pelanggan Atlassian Isolated Cloud
- Pelanggan dengan kewajiban HIPAA
Konteks dan pentingnya
- Kebijakan ini berbalik arah dari posisi sebelumnya
- Sebelumnya Atlassian menyatakan tidak menggunakan data pelanggan untuk melatih atau meningkatkan layanan AI
- Arus industri yang diajukan sebagai latar belakang perubahan
- Vendor SaaS mengumpulkan sinyal penggunaan internal dan konten untuk bootstrap model, fine-tuning, dan evaluasi
- Pada saat yang sama mereka menjanjikan analisis berbasis anonimisasi dan agregasi
- Manfaat praktis yang disebutkan Atlassian
- Peningkatan relevansi pencarian
- Ringkasan yang lebih baik
- Saran template
- Optimasi workflow berbasis agen
- Dampak dari sudut pandang praktisi di lapangan
- Perubahan pada asal data model yang digunakan di alat kerja
- Perubahan tingkat kontrol data menurut harga paket serta tolok ukur kepatuhan dan pengadaan
Risiko dan trade-off
- Pengumpulan metadata wajib bagi pelanggan non-Enterprise menimbulkan kekhawatiran privasi dan tata kelola, terlepas dari apakah pengenal dihapus atau tidak
- Telemetri seperti story point dan metrik SLA dapat mengungkap struktur proyek dan pola kinerja
- Penyimpanan selama 7 tahun untuk data yang dianonimkan memperluas permukaan paparan seiring waktu
- Hal ini dapat menambah beban bagi pelanggan yang memerlukan audit retensi data jangka panjang
- Tersedia jalur pengecualian untuk pelanggan dengan kebutuhan keamanan tinggi dan pengguna customer-managed keys
- Namun, ini dapat mengharuskan perpindahan ke paket yang lebih mahal atau bentuk deployment khusus
Hal yang perlu diperhatikan
- Organisasi perlu meninjau tenant Atlassian masing-masing
- Perlu memeriksa paket aktif tertinggi per tenant
- Perlu memahami pengaturan kontribusi data default
- Selama periode rollout, pengaturan administratif perlu diperbarui
- Jika memerlukan opt-out sepenuhnya, perlu mempertimbangkan migrasi ke Enterprise atau deployment terisolasi
- Dari sisi produk, poin yang patut diamati
- Perlu dikonfirmasi bagaimana Atlassian benar-benar menjalankan prosedur pelatihan ulang 90 hari
- Perlu dikonfirmasi apakah pemasok LLM downstream yang digunakan di Rovo menyatakan tidak menyimpan input
- Jika pola ini menyebar ke SaaS enterprise secara luas, ada kemungkinan muncul penolakan pelanggan dan pengawasan regulator
Dasar penilaian
- Perubahan ini berdampak nyata bagi ribuan pengguna enterprise dan praktisi yang menangani tata kelola data serta pengelolaan asal model
- Ini tidak diposisikan sebagai model mutakhir atau tonggak regulasi
- Perubahan ini dinilai sebagai perubahan kebijakan produk yang secara nyata mengubah pipeline data tim dan pilihan kepatuhan
1 komentar
Komentar Hacker News
Saya merasa Atlassian hanya terus membuat kesalahan demi kesalahan. Saya masih sering memakai produknya, tetapi frekuensi saya menemui bug level P0 terlalu tinggi. self-hosted Bitbucket workers khususnya sudah sangat usang, terutama di sisi Docker, sampai-sampai kami harus menambalnya dengan banyak solusi sementara. Di JIRA, untuk mengubah urutan tiket baru saja sudah bertahun-tahun masih perlu refresh. Fitur-fitur baru yang ditambahkan ke JIRA dan Bitbucket dalam beberapa tahun terakhir juga sering tidak berjalan dengan baik. Saya juga sempat mencoba fitur AI lewat free trial, tetapi sama sekali tidak berfungsi, dan pembatalannya pun tidak bisa dilakukan secara online sehingga saya harus membuat beberapa tiket dukungan, sementara formulir dukungannya sendiri berkali-kali rusak. Saya jadi penasaran kenapa kerusakan fungsi bisa sampai separah ini, apakah karena utang teknis, eksodus talenta, atau keduanya. Kalau melihat komunitasnya, tampak ratusan sampai ribuan bug dengan berbagai workaround yang menempel
Saya ingin bisa menautkan sumber yang lebih baik, tetapi poin utamanya menurut saya adalah bahwa pelanggan gratis maupun berbayar saat ini secara default ikut serta memberikan data untuk pelatihan AI. Semua isi seperti halaman Confluence dan tiket Jira termasuk di dalamnya. Dokumen dukungan Atlassian memang menjelaskan cara mematikannya, tetapi di instance kami pengaturan itu sendiri tidak muncul
Saya melihat rumor bahwa Anthropic sedang membahas akuisisi Atlassian dan kemungkinan alasannya adalah data pelatihan. Bahkan sudah ada posting Reddit yang menyebut pergerakan data poisoning juga sudah mulai beredar
Saya merasa di enterprise SaaS, pola pengumpulan sebagai default alih-alih opt-out default makin dinormalisasi. Tetapi kasus ini sangat serius karena cakupannya bukan sekadar metadata, melainkan semua konten di dalam aplikasi, dan di atas itu pengaturan opt-out-nya sendiri bahkan tidak dirender. Keputusan kebijakannya sendiri mungkin masih bisa diperdebatkan, tetapi kalau dua hal itu digabung, jadinya terlihat seperti sengaja menciptakan friksi. Soal data residency juga perlu dipisahkan pembahasannya, karena banyak pembeli mengira penguncian wilayah berarti jaminan privasi penuh, padahal itu hanya berarti lokasi penyimpanan, bukan siapa yang bisa mengakses data dan untuk tujuan apa
Saya melihat banyak perusahaan lain seperti GitHub, Figma, Adobe, dan Vercel juga mengaktifkan hal seperti ini secara default. Jadi rasanya realistis untuk berasumsi bahwa kalau kita menitipkan data ke perusahaan mana pun, pada dasarnya mereka bisa memakainya untuk pelatihan model
Kalau rumor akuisisi Anthropic itu benar, saya pikir Atlassian akan terlihat sebagai peluang untuk membeli satu paket dataset bersinyal tinggi di sekitar pekerjaan bisnis
Saya penasaran apakah Atlassian juga menjadikan kode dan konten dari repositori private Bitbucket sebagai objek pengumpulan. Teks kebijakan dan FAQ-nya ambigu, jadi saya ingin jawaban yang jelas berupa ya atau tidak
Dulu ada ungkapan bahwa kalau kita tidak membayar maka kita adalah produknya, tetapi sekarang perusahaan bahkan membayar dan menjadikan dirinya sendiri produk, jadi terasa lebih absurd lagi
Saya ingin benar-benar menekankan bahwa opsi data residency Atlassian tidak mencegah masalah ini. Walaupun data diikat ke wilayah tertentu, data itu tetap bisa dipakai untuk tujuan pelatihan
Jadi saya merasa sekarang makin jelas kenapa Atlassian ingin mengurangi dukungan Data Center untuk on-prem