1 poin oleh GN⁺ 1 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Metadata pelanggan dan konten dalam aplikasi dari produk Atlassian Cloud seperti Jira dan Confluence akan digunakan secara default untuk pelatihan Rovo dan Rovo Dev mulai 17 Agustus 2026
  • Nilai default diterapkan berbeda menurut paket, dan pada Free, Standard, serta Premium, kontribusi metadata selalu aktif, sementara hanya Enterprise yang mempertahankan kondisi default nonaktif untuk metadata dan data dalam aplikasi serta hak kontrol penuh
  • Cakupan pengumpulan mencakup metadata seperti skor keterbacaan, story point, nilai SLA, serta data dalam aplikasi seperti isi halaman, deskripsi issue, komentar, dan nama workflow
  • Langkah perlindungan seperti penghapusan pengenal langsung dan agregasi diterapkan, tetapi data kontribusi disimpan hingga 7 tahun; setelah penghapusan atau opt-out, data dalam aplikasi dihapus dalam 30 hari dan model yang dilatih akan dilatih ulang dalam 90 hari
  • Pergeseran kebijakan ini mengubah posisi sebelumnya yang tidak menggunakan data untuk pelatihan, sekaligus mengubah asal data alat kerja dan tingkat kontrol menurut harga paket, sehingga memperluas dampaknya pada penilaian privasi, tata kelola, dan kepatuhan

Ringkasan perubahan

  • Atlassian akan menggunakan secara default metadata pelanggan dan konten dalam aplikasi dari Jira, Confluence, dan produk Atlassian Cloud lainnya untuk pelatihan AI mulai 17 Agustus 2026
    • Fitur AI yang disebutkan secara spesifik adalah Rovo dan Rovo Dev
    • Skala dampak sekitar 300 ribu pelanggan
  • Perubahan kebijakan kontribusi data membuat nilai default berbeda menurut paket
    • Paket tingkat bawah tidak bisa melakukan opt-out dari pengumpulan metadata
    • Paket Enterprise tetap memiliki kontrol atas pengumpulan metadata dan data dalam aplikasi
  • Masa simpan data kontribusi yang dikumpulkan hingga 7 tahun
    • Setelah penghapusan atau opt-out, data dalam aplikasi akan dihapus dalam 30 hari
    • Model yang dilatih menggunakan data tersebut akan dilatih ulang dalam 90 hari untuk menghapus kontribusinya

Detail teknis

  • Atlassian membagi cakupan pengumpulan ke dalam dua kategori: metadata dan data dalam aplikasi
    • Metadata mencakup sinyal yang telah dianonimkan
    • Data dalam aplikasi mencakup konten buatan pengguna
  • Item yang termasuk dalam kategori metadata diperinci sebagai berikut
    • Skor keterbacaan dan kompleksitas
    • Klasifikasi pekerjaan
    • Indikator kemiripan semantik
    • Story point
    • Tanggal akhir sprint
    • Nilai SLA di Jira Service Management
  • Item yang termasuk dalam kategori data dalam aplikasi diperinci sebagai berikut
    • Judul dan isi halaman di Confluence
    • Judul issue, deskripsi, dan komentar di Jira
    • Nama emoji kustom
    • Nama status kustom
    • Nama workflow
  • Sebagai proses sebelum pelatihan, Atlassian menyebutkan penerapan penghapusan pengenal langsung, agregasi data, dan langkah perlindungan lainnya

Pengaturan default per paket dan pihak yang dikecualikan

  • Pengaturan default ditentukan berdasarkan paket aktif tertinggi dalam organisasi
  • Pelanggan Free dan Standard
    • Kontribusi metadata selalu aktif

      • Tidak bisa melakukan opt-out dari pengumpulan metadata
      • Kontribusi data dalam aplikasi aktif secara default, tetapi pengaturannya bisa diubah
      • Pelanggan Premium
      • Kontribusi metadata selalu aktif
      • Kontribusi data dalam aplikasi nonaktif secara default
      • Pelanggan Enterprise
      • Metadata dan data dalam aplikasi sama-sama nonaktif secara default
      • Opt-out metadata dimungkinkan
      • Kelompok pelanggan yang dikecualikan dari seluruh cakupan pengumpulan juga disebutkan
      • Pelanggan yang menggunakan customer-managed encryption keys
      • Pelanggan Atlassian Government Cloud
      • Pelanggan Atlassian Isolated Cloud
      • Pelanggan dengan kewajiban HIPAA

Konteks dan pentingnya

  • Kebijakan ini berbalik arah dari posisi sebelumnya
    • Sebelumnya Atlassian menyatakan tidak menggunakan data pelanggan untuk melatih atau meningkatkan layanan AI
  • Arus industri yang diajukan sebagai latar belakang perubahan
    • Vendor SaaS mengumpulkan sinyal penggunaan internal dan konten untuk bootstrap model, fine-tuning, dan evaluasi
    • Pada saat yang sama mereka menjanjikan analisis berbasis anonimisasi dan agregasi
  • Manfaat praktis yang disebutkan Atlassian
    • Peningkatan relevansi pencarian
    • Ringkasan yang lebih baik
    • Saran template
    • Optimasi workflow berbasis agen
  • Dampak dari sudut pandang praktisi di lapangan
    • Perubahan pada asal data model yang digunakan di alat kerja
    • Perubahan tingkat kontrol data menurut harga paket serta tolok ukur kepatuhan dan pengadaan

Risiko dan trade-off

  • Pengumpulan metadata wajib bagi pelanggan non-Enterprise menimbulkan kekhawatiran privasi dan tata kelola, terlepas dari apakah pengenal dihapus atau tidak
    • Telemetri seperti story point dan metrik SLA dapat mengungkap struktur proyek dan pola kinerja
  • Penyimpanan selama 7 tahun untuk data yang dianonimkan memperluas permukaan paparan seiring waktu
    • Hal ini dapat menambah beban bagi pelanggan yang memerlukan audit retensi data jangka panjang
  • Tersedia jalur pengecualian untuk pelanggan dengan kebutuhan keamanan tinggi dan pengguna customer-managed keys
    • Namun, ini dapat mengharuskan perpindahan ke paket yang lebih mahal atau bentuk deployment khusus

Hal yang perlu diperhatikan

  • Organisasi perlu meninjau tenant Atlassian masing-masing
    • Perlu memeriksa paket aktif tertinggi per tenant
    • Perlu memahami pengaturan kontribusi data default
  • Selama periode rollout, pengaturan administratif perlu diperbarui
  • Jika memerlukan opt-out sepenuhnya, perlu mempertimbangkan migrasi ke Enterprise atau deployment terisolasi
  • Dari sisi produk, poin yang patut diamati
    • Perlu dikonfirmasi bagaimana Atlassian benar-benar menjalankan prosedur pelatihan ulang 90 hari
    • Perlu dikonfirmasi apakah pemasok LLM downstream yang digunakan di Rovo menyatakan tidak menyimpan input
  • Jika pola ini menyebar ke SaaS enterprise secara luas, ada kemungkinan muncul penolakan pelanggan dan pengawasan regulator

Dasar penilaian

  • Perubahan ini berdampak nyata bagi ribuan pengguna enterprise dan praktisi yang menangani tata kelola data serta pengelolaan asal model
  • Ini tidak diposisikan sebagai model mutakhir atau tonggak regulasi
  • Perubahan ini dinilai sebagai perubahan kebijakan produk yang secara nyata mengubah pipeline data tim dan pilihan kepatuhan

1 komentar

 
GN⁺ 1 jam lalu
Komentar Hacker News
  • Saya merasa Atlassian hanya terus membuat kesalahan demi kesalahan. Saya masih sering memakai produknya, tetapi frekuensi saya menemui bug level P0 terlalu tinggi. self-hosted Bitbucket workers khususnya sudah sangat usang, terutama di sisi Docker, sampai-sampai kami harus menambalnya dengan banyak solusi sementara. Di JIRA, untuk mengubah urutan tiket baru saja sudah bertahun-tahun masih perlu refresh. Fitur-fitur baru yang ditambahkan ke JIRA dan Bitbucket dalam beberapa tahun terakhir juga sering tidak berjalan dengan baik. Saya juga sempat mencoba fitur AI lewat free trial, tetapi sama sekali tidak berfungsi, dan pembatalannya pun tidak bisa dilakukan secara online sehingga saya harus membuat beberapa tiket dukungan, sementara formulir dukungannya sendiri berkali-kali rusak. Saya jadi penasaran kenapa kerusakan fungsi bisa sampai separah ini, apakah karena utang teknis, eksodus talenta, atau keduanya. Kalau melihat komunitasnya, tampak ratusan sampai ribuan bug dengan berbagai workaround yang menempel

    • Menurut saya, pembatalan free trial yang diblokir secara online itu tidak bisa dijelaskan selain sebagai penipuan terhadap pelanggan. Hal seperti ini rasanya juga sangat mudah dicegah lewat hukum, tetapi tampaknya pemerintah tidak tertarik. Atlassian terlihat seperti perusahaan besar tipikal yang menjual ke atasan para penggunanya, bukan ke penggunanya sendiri. Begitu melewati skala tertentu dan tekanan untuk bersaing lewat kualitas melemah, saya merasa korupsi internal dan ketidakmampuan mudah menyebar
    • Sebagai orang yang pernah bekerja di sana, menurut saya jawabannya adalah gabungan dari kurangnya kapabilitas engineering, prioritas yang tercerai-berai, dan restrukturisasi organisasi yang tidak bermakna. Bitbucket pipelines dan workers pada dasarnya awalnya dibuat oleh dua orang, dan kemungkinan hanya sekitar satu orang yang benar-benar aktif memeliharanya selama 10 tahun terakhir. Jika belum lama ini memang ada PHK, mungkin kondisinya jadi lebih parah. Kantornya sekarang bahkan sudah tidak ada secara fisik, dan orang-orang dari masa itu juga semuanya sudah pergi
    • Menurut saya penyebabnya dalam satu kata adalah Featureitis. Caranya ya terus mendorong fitur tanpa pikir panjang. Sekarang bahkan tampaknya ada kemungkinan kode buatan AI ikut ditumpuk di atasnya. Di proyek skala menengah pun, kalau yang didorong terus hanya fitur baru, hasilnya bisa mirip begini, dan beberapa proyek yang pernah saya alami juga berakhir di jalur yang sama karena yang penting cuma centang fitur dari backlog raksasa
    • Saya merasa fitur pencarian Jira memang selalu berada di level yang nyaris tidak bisa dipakai. Itu mungkin bagian terburuk dari seluruh platform, tetapi melihat mereka masih fokus menambah fitur-fitur yang jelas tidak akan pernah saya pakai rasanya membuat putus asa
    • Saya merasa Jira belakangan ini terlalu tidak stabil karena sinkronisasi yang kacau. Di sprint board, modal tiket menutup sendiri sehingga saya harus terus membukanya lagi, dan belum lama ini ada tiket yang sama sekali tidak mau muncul di board itu apa pun yang saya lakukan, lalu belakangan epic-nya tiba-tiba muncul dan setelah itu tiket individualnya juga muncul lagi. Kalau ini yang disebut nilai tambah vibe coding bagi dunia, rasanya menyedihkan
  • Saya ingin bisa menautkan sumber yang lebih baik, tetapi poin utamanya menurut saya adalah bahwa pelanggan gratis maupun berbayar saat ini secara default ikut serta memberikan data untuk pelatihan AI. Semua isi seperti halaman Confluence dan tiket Jira termasuk di dalamnya. Dokumen dukungan Atlassian memang menjelaskan cara mematikannya, tetapi di instance kami pengaturan itu sendiri tidak muncul

    • Dari pemberitahuan yang saya terima lewat email, pemahaman saya adalah bahwa pengaturan opt-out akan diluncurkan bertahap di Admin portal mulai Mei. Itu lebih dulu berlaku untuk Jira, Confluence, Jira Service Management, dan aplikasi Atlassian Platform, lalu akan muncul secara bertahap di Atlassian Administration hingga 19 Mei 2026, dan mereka akan memberi tahu lagi sebelum 17 Agustus 2026
    • Saya sudah membongkar Atlassian Administration > Security dan berbagai halaman pengaturan lain, tetapi sama sekali tidak menemukan item Data contribution. Kalau begitu, apakah artinya saat ini orang otomatis opt-in tetapi pada praktiknya belum ada cara untuk opt-out?
    • Saya terkejut melihat cakupan yang tertulis di FAQ. Disebut sebagai konten buatan pengguna, tetapi itu berarti judul dan isi Confluence, judul issue dan deskripsi Jira, komentar, nama emoji kustom, nama status kustom, sampai nama workflow juga ikut tercakup, jadi ruang lingkupnya terlalu luas
    • Saya khawatir apakah bahkan informasi sensitif seperti data pelanggan, tiket privat, isi perbaikan CVE yang masih embargo, atau informasi kesehatan sensitif bisa ikut tercampur untuk melatih model lalu bocor kemudian ke orang yang sama sekali tidak berhak
    • Untuk penjelasan resmi mengenai perubahan ini, menurut saya yang paling langsung adalah merujuk ke FAQ Atlassian
  • Saya melihat rumor bahwa Anthropic sedang membahas akuisisi Atlassian dan kemungkinan alasannya adalah data pelatihan. Bahkan sudah ada posting Reddit yang menyebut pergerakan data poisoning juga sudah mulai beredar

    • Kalau itu benar, saya tahu setidaknya ada dua perusahaan yang tidak akan bisa lagi memakai produk Atlassian. Itu akan dibaca sebagai sinyal bahwa mereka terlalu meremehkan privasi dan tuntutan regulasi
    • Dulu kalau source code dari tempat seperti GitHub di-scrape lalu AI menghasilkan kode dari sana, sekarang rasanya kita masuk ke tahap di mana dokumen spesifikasi dari tempat seperti Atlassian yang di-scrape lalu AI menghasilkannya kembali. Lalu sumber berikutnya apa, saya jadi membayangkan dengan getir apakah sampai pernyataan misi perusahaan atau slogan cari uang pun nanti ikut jadi sasaran
    • Kalau harga sahamnya terus turun, saya rasa akuisisi seperti itu memang bisa saja benar-benar terjadi
  • Saya merasa di enterprise SaaS, pola pengumpulan sebagai default alih-alih opt-out default makin dinormalisasi. Tetapi kasus ini sangat serius karena cakupannya bukan sekadar metadata, melainkan semua konten di dalam aplikasi, dan di atas itu pengaturan opt-out-nya sendiri bahkan tidak dirender. Keputusan kebijakannya sendiri mungkin masih bisa diperdebatkan, tetapi kalau dua hal itu digabung, jadinya terlihat seperti sengaja menciptakan friksi. Soal data residency juga perlu dipisahkan pembahasannya, karena banyak pembeli mengira penguncian wilayah berarti jaminan privasi penuh, padahal itu hanya berarti lokasi penyimpanan, bukan siapa yang bisa mengakses data dan untuk tujuan apa

    • Saya khususnya merasa frasa di artikel The Register yang menyatakan bahwa bahkan jika kontrak dihentikan sekarang, pengaturan data contribution yang baru tetap baru berlaku pada 17 Agustus 2026 terdengar lebih licik lagi. Artinya, struktur ini pada praktiknya bahkan tidak memberi waktu untuk meninjau pilihan lain
  • Saya melihat banyak perusahaan lain seperti GitHub, Figma, Adobe, dan Vercel juga mengaktifkan hal seperti ini secara default. Jadi rasanya realistis untuk berasumsi bahwa kalau kita menitipkan data ke perusahaan mana pun, pada dasarnya mereka bisa memakainya untuk pelatihan model

    • Mungkin tahun ini akan menjadi tahun self-hosted. Untuk hal-hal seperti blog publik yang privasinya tidak terlalu penting, saya masih menaruhnya di cloud, tetapi untuk data yang tidak ingin saya pakai untuk pelatihan model atau penjualan iklan, saya sudah memindahkannya agar di-host langsung di jaringan saya sendiri
  • Kalau rumor akuisisi Anthropic itu benar, saya pikir Atlassian akan terlihat sebagai peluang untuk membeli satu paket dataset bersinyal tinggi di sekitar pekerjaan bisnis

    • Kadang saya malah membayangkan dengan sindiran bahwa mungkin masalahnya akan selesai selamanya kalau Broadcom membeli Atlassian lalu memperlakukannya seperti VMware
    • Saya tidak menganggap data di dalam Atlassian sebagai dataset yang bersih atau alami. Rasanya lebih seperti ruang dengan desain dari neraka yang menelan pekerjaan developer sungguhan ke dalam segala macam noise
    • Kalau rumor seperti ini masih sekadar spekulasi forum, saya tidak akan mempercayainya sampai ada sumber tepercaya yang muncul. Kedengarannya juga seperti cerita untuk mengerek saham lalu membuangnya
  • Saya penasaran apakah Atlassian juga menjadikan kode dan konten dari repositori private Bitbucket sebagai objek pengumpulan. Teks kebijakan dan FAQ-nya ambigu, jadi saya ingin jawaban yang jelas berupa ya atau tidak

    • Waktu saya mencarinya beberapa bulan lalu, saya menafsirkan bahwa mereka tidak melatih AI dengan kode repo privat, tetapi setelah pengumuman kali ini, saya tetap berniat memindahkannya ke server saya sendiri. Penyimpanan cloud memang nyaman, tetapi terus khawatir suatu hari ada orang datang lalu mengambil data saya seolah itu milik mereka sendiri rasanya tidak layak ditoleransi
    • Kalau redaksinya ambigu, menurut saya itu pada dasarnya berarti jawabannya sudah jelas
  • Dulu ada ungkapan bahwa kalau kita tidak membayar maka kita adalah produknya, tetapi sekarang perusahaan bahkan membayar dan menjadikan dirinya sendiri produk, jadi terasa lebih absurd lagi

  • Saya ingin benar-benar menekankan bahwa opsi data residency Atlassian tidak mencegah masalah ini. Walaupun data diikat ke wilayah tertentu, data itu tetap bisa dipakai untuk tujuan pelatihan

  • Jadi saya merasa sekarang makin jelas kenapa Atlassian ingin mengurangi dukungan Data Center untuk on-prem