2 poin oleh GN⁺ 2025-07-07 | 1 komentar | Bagikan ke WhatsApp
  • Huawei menghadapi tuduhan dari pelapor internal bahwa perusahaan menyalin model AI besar dari Qwen dan DeepSeek lalu menampilkannya sebagai produk internal bernama ‘Pangu’
  • Menurut kesaksian karyawan internal tim Pangu, sebagian model yang substantif bukan dikembangkan sendiri, melainkan hanya berganti nama dari model open source eksternal
  • Secara teknis terungkap bahwa model utama seperti 135B V2 dan Pro MoE 72B memiliki tingkat kesamaan yang tinggi dengan arsitektur Qwen dan DeepSeek
  • Di internal, praktik ini disebut telah menyebabkan moral peneliti merosot dan banyak yang hengkang, sementara inefisiensi administratif dan kebijakan SDM yang tidak transparan memperparah masalah
  • Meski ada juga model yang benar-benar dikembangkan secara mandiri (seperti Pangu V3), budaya penyalinan dan minimnya pengakuan terhadap riset meninggalkan luka besar pada kepercayaan organisasi secara keseluruhan
  • Pelapor internal menyatakan dirinya memutuskan mengungkap kebenaran dengan identitas asli dan mendesak organisasi untuk berefleksi serta berubah

Tragedi Pangu: Sisi Dalam yang Menyakitkan dari Model Besar Pangu milik Huawei Noah Ark Lab

Perkenalan pelapor internal dan suasana di lapangan

  • Penulis merupakan anggota tim model besar Huawei Noah Pangu, dan memverifikasi identitasnya dengan mencocokkan struktur organisasi-proyek utama serta susunan kepemimpinan dengan informasi internal
  • Proyek Pangu pada praktiknya lebih mirip organisasi pengiriman daripada organisasi riset, dan terus dibebani tenggat berulang, kerja berlebihan, serta tekanan evaluasi dan pelaporan yang tak henti-hentinya
  • Intensitas kerja dan birokrasi sangat ekstrem, dengan kondisi tinggal lama terpisah dari keluarga di akomodasi perusahaan serta kerja akhir pekan yang kerap terjadi
  • Pada kenyataannya, budaya perusahaan lebih didominasi fokus pada tenggat dan kinerja tiap lini produk (Cloud, ICT, dll.) ketimbang otonomi dan kreativitas riset

Malam tanpa tidur, kesadaran berkarya yang diinjak-injak

  • Setelah kontroversi plagiarisme model Qwen, sebagian peneliti mengalami rasa malu, marah, dan tak berdaya secara bersamaan
  • Pelapor sendiri takut pada pembalasan dari korporasi besar dan jaringan internal, tetapi memutuskan berbicara menurut hati nurani karena tidak lagi mampu menoleransi penutupan fakta dan promosi eksternal yang penuh kebohongan

Hambatan teknis dan awal mula plagiarisme

  • Pada tahap awal, model Pangu mencoba dilatih sendiri di atas NPU Ascend milik Huawei, tetapi mengalami trial and error serius seperti efisiensi tokenizer yang buruk dan performa model yang lemah
  • Mereka tertinggal dari model berbasis GPU milik pesaing (Alibaba, Zhipu), dan pelatihan model dense 230B buatan sendiri berakhir gagal
  • Karena itu, lab model kecil membungkusnya sebagai “pengembangan internal”, padahal sebenarnya membuat 135B V2 dengan mengkloning dan sedikit memodifikasi model Qwen-1.5 (110B) untuk dipasok, dan kemiripan kode serta struktur juga terlihat di internal
  • Pimpinan utama dan manajemen mengetahui kenyataan ini, namun membiarkannya demi tekanan capaian dan hasil eksternal

Pencapaian teknis yang sesungguhnya: Pangu V3

  • Setelah berjuang keras, tim akhirnya melatih model Pangu V3 (135B Ultra) yang sepenuhnya dikembangkan sendiri dari awal secara independen di Ascend
  • Dengan mengatasi berbagai hambatan teknis seperti penyatuan tokenizer dan stabilisasi kurva loss, tim berhasil mencapai performa yang sebanding dengan pesaing
  • Pencapaian ini menjadi bukti pengembangan model besar yang orisinal, bukan hasil plagiarisme, dan menjadi sumber kebanggaan para peneliti

Kerja keras yang tak diakui di balik pembagian kerja

  • Lab model kecil terus-menerus mengambil data, kode, dan hasil kerja lalu dengan mudah memodifikasi/menyebarkan model, sementara pencapaian dan penghargaan sebagian besar jatuh ke organisasi tersebut
  • Akibatnya, para peneliti yang berdedikasi secara getir mengungkapkan bahwa mereka akhirnya keluar dari organisasi atau meninggalkan noda dalam perjalanan karier teknis mereka

Kasus plagiarisme kedua seperti klon 224B MoE/718B

  • Dalam proses pengembangan model MoE 718B yang baru, DeepSeekv3 juga disebut hampir disalin mentah-mentah lalu dinamai Pangu Pro MoE 72B dan didistribusikan
  • Di internal, praktik semacam ini diketahui, tetapi suasananya cenderung ditutup-tutupi karena ketakutan akan kelangsungan hidup masing-masing dan kebenaran yang terungkap

Manajemen administratif yang tidak masuk akal

  • Bagi peneliti yang benar-benar melakukan riset, diterapkan proses, silsilah model, dan sistem audit yang ketat sehingga kecepatan pengembangan melambat
  • Namun untuk model hasil kloning, standar ganda yang mengakar tetap berlaku: “kalau dari atas, semuanya lolos”

Alasan pengungkapan dan keputusan untuk mundur

  • Setelah insiden HonestAGI, upaya manajemen krisis tingkat perusahaan dan penutupan internal mulai dijalankan
  • Pelapor menyatakan tidak lagi bisa ikut serta dalam “laporan palsu” dan kolusi internal, serta mengungkap niat untuk menghapus namanya dari daftar anggota tim dan laporan, lalu mengundurkan diri secara sukarela

Seruan terakhir dan rasa sayang pada rekan-rekan

  • Rekan-rekan sudah banyak pindah ke perusahaan lain seperti ByteDance, DeepSeek, Tencent, dan Kuaishou, yang menunjukkan arus keluar talenta Huawei sudah sangat serius
  • Ia menegaskan bahwa dengan inovasi, lingkungan yang tepat, dan hambatan politik yang lebih sedikit, pengembangan model besar dan chip kelas dunia pun sebenarnya mungkin dicapai
  • Ia juga menyatakan kesediaan menanggung risiko atas kebenaran isi ini, termasuk kemungkinan ancaman terhadap keselamatan dirinya dan keluarganya akibat pengungkapan tambahan

Penjelasan situasi tambahan

  • Dalam kasus klon 135B V2, lab model kecil hanya mengambil manfaat seperti penghargaan dan insentif, sementara beban dukungan downstream dan pemeliharaan dialihkan ke tim pengembang asli (4th brigade)
  • Bahkan dalam pencantuman penulis laporan teknis Pangu, praktik akademik yang tidak adil disebut merajalela: orang yang memberi kontribusi kunci pada pengembangan model justru dikeluarkan, sementara orang nonkontributor dari lab model kecil dimasukkan

1 komentar

 
GN⁺ 2025-07-07
Komentar Hacker News
  • Ada pandangan bahwa penulis posting asli terlihat agak naif. Tim Ascend pada awalnya memang tertinggal dari Nvidia dari sisi performa (berdasarkan NPU 910A generasi pertama), dan itu hasil yang wajar. Manajemen lalu mendukung tim yang mengikuti alternatif berbasis GPU yang bisa segera dikomersialkan, dan arah ini mengeras karena politik internal. Tim Ascend pada akhirnya berhasil menyelesaikan masalah teknis, tetapi banyak anggotanya mengalami burnout atau pindah ke perusahaan AI Tiongkok lain karena perlakuan tidak adil, keberpihakan birokratis, dan minimnya pengakuan. HW (mungkin Huawei) sudah lama punya strategi dan budaya yang mengeksploitasi talenta tier-1; bahkan pada 1990-an, ketika operator telekomunikasi RRT merekrut orang dari Nortel, Siemens, dan Lucent, talenta keturunan Tionghoa yang terbiasa dengan budaya kerja Barat kesulitan beradaptasi dengan budaya perusahaan Tiongkok yang sebenarnya dan mengalami burnout. Meski begitu, HW pada akhirnya mendominasi industri lewat kultur kerja yang agresif. Kini, setelah sanksi, nilainya melonjak besar karena menjadi perusahaan strategis di bidang semikonduktor, chip domestik, dan AI. Dalam lingkungan internasional saat ini, HW berada pada posisi yang memungkinkannya melakukan apa pun demi dominasi pasar. Dari surat pengunduran diri ini, terlihat bahwa HW pada akhirnya berhasil mendorong Ascend ke tingkat yang bisa berfungsi dengan memasukkan cukup banyak talenta, dan kemungkinan akan terus memasukkan talenta sampai bisa bersaing dengan Nvidia. Penulis, seperti kebanyakan pekerja, punya intuisi bahwa kompensasi yang adil dan lingkungan kerja yang baik itu penting bagi karyawan. Tetapi selama 30 tahun terakhir, HW terus menang dengan memberi gaji sangat besar kepada banyak orang cerdas (termasuk patriot), melemparkan mereka ke pemecahan masalah, dan memaksa mereka sampai tenaga manusianya hancur
  • LLM pada dasarnya sama sekali tidak kompatibel dengan hak cipta. Jika sejak awal sudah bisa dilatih memakai data milik orang lain tanpa membayar sepeser pun, maka logikanya penyalinan juga bebas. Pada akhirnya ini dilihat sebagai efek boomerang dari penyalinan
    • Secara naif memang tidak kompatibel, tetapi ada anggapan bahwa para pengacara pada akhirnya akan menemukan cara untuk melegalkannya
  • Dulu penerbit peta memasukkan gang palsu agar pelanggaran hak cipta mudah dideteksi. Ada yang penasaran apakah cara ini bisa diterapkan juga pada LLM
    • Saat bekerja di Malwarebytes, pernah ada kecurigaan bahwa IOBit mencuri DB. Buktinya jelas, tetapi agar orang awam juga mudah memahaminya, mereka membuat program produk baru yang hanya ada di satu mesin saja lalu menambahkan signaturnya ke DB. Program tersebut adalah non-malicious yang tidak mungkin benar-benar tersebar, dan ketika pihak lawan menambahkannya ke DB mereka, kasus itu dipublikasikan di blog dan memicu reaksi besar. Kasus terkait: insiden pencurian IOBit
    • Contoh klasiknya adalah memasukkan cacat atau anomali yang sangat kecil dan tidak berbahaya secara sengaja ke chip komputer. Banyak produk buatan Tiongkok merupakan hasil reverse engineering dari perusahaan lain seperti TI, jadi cacat semacam itu sering ada. Bahkan di dalam Tiongkok sendiri mereka saling melakukan hal yang sama. Semuanya dianggap sama-sama memakai jalan pintas
    • Ada yang pernah menemukan contoh proyek bernama OML 1.0: Fingerprinting. Ini adalah alat untuk menanam sidik jari pada model guna mengidentifikasi kepemilikan LLM dan mencegah penggunaan tanpa izin
    • YouTuber Jay Foreman pernah membuat video tentang gang palsu di peta
    • Dalam tulisan pengaduan berbahasa Tionghoa aslinya, ada isi berikut: mereka terkejut karena analisis Honestagi menunjukkan kemiripan yang tinggi meskipun model itu telah melalui pelatihan tambahan yang sangat lama. Sumber daya komputasi yang dipakai untuk “mencuci” parameter model tersebut sudah cukup untuk membuat model baru di kelas yang sama. Menurut rekan-rekan, bahkan ada berbagai upaya seperti sengaja melatihnya dengan data yang terkontaminasi untuk menghapus watermark Qwen. Metode seperti ini kemungkinan akan menjadi kasus yang belum pernah ada sebelumnya dalam bidang penelitian garis keturunan model, dan di masa depan bisa dipakai sebagai contoh saat memverifikasi metodologi riset baru
  • Apple merilis LLM yang berbasis Qwen2.5-Coder-7B sambil menambahkan idenya sendiri. Perubahan utamanya adalah pelatihan kustom dengan contoh kode milik Apple, dan jika temperatur dinaikkan model itu bisa menghasilkan beberapa blok kode tanpa mengikuti urutan. Artikel terkait: berita tentang Apple LLM diskusi HN
  • Penekanan pada efisiensi ala Tiongkok. Ada pendapat bahwa Barat terhambat oleh hukum hak cipta dari masa lalu
  • Ini laporan yang sangat manusiawi dan jujur. Isinya menunjukkan kekacauan di dalam perusahaan besar dan struktur di mana manajemen memberi tekanan yang lebih menguntungkan tim yang tidak jujur. Penulis sudah meninggalkan perusahaan, dan dinilai sebagai orang yang baik
    • Sebenarnya laporan ini perlu dilihat dalam konteks surat pengunduran diri lain yang belakangan bermunculan di Tiongkok. Tulisan mundur dari seorang veteran Alibaba dengan masa kerja 15 tahun baru-baru ini juga mengkritik merosotnya budaya perusahaan besar sebagai penyebab turunnya daya saing dan gagalnya produk baru. Pokok laporan ini adalah: 1. kepalsuan pada level nasional tentang kemampuan Huawei 2. kepalsuan terhadap pelanggan berbayar 3. kenyataan bahwa manipulasi metrik kinerja pada dasarnya ditoleransi atau didorong di bawah sistem manajemen yang terobsesi KPI (dan hilangnya idealisme serta kepercayaan penulis adalah inti laporan ini)
  • Ada yang merasa kalimat “Sabtu pada dasarnya adalah hari kerja, tetapi kadang ada waktu minum teh sore atau bahkan hidangan udang karang” punya nuansa puitis. Mereka penasaran apakah ada alasan khusus kenapa crayfish disajikan dalam situasi seperti itu
    • Dugaannya, “meskipun Sabtu hari kerja, kadang ada camilan, dan bisa jadi crayfish memang sangat populer, atau mungkin ini salah terjemahan”
  • Ada yang heran melihat penjelasan organisasi “kami berada di bawah proyek 'Angkatan Lapangan Keempat', dan LLM bahasa inti adalah Brigade ke-4, kelompok model kecil Wang Yunhe adalah Brigade ke-16”. Mereka bertanya-tanya apakah ini benar-benar organisasi yang berafiliasi dengan tentara Partai Komunis
    • Ada pendapat bahwa Angkatan Lapangan Keempat yang asli sudah tidak ada sejak 1955, dan nama itu kemungkinan hanya dipakai terus sebagai codename proyek LLM
    • Disebut juga budaya perusahaan Huawei yang bergaya militer. Orientasi karyawan baru pun dijalankan seperti upacara kelulusan pelatihan militer. Referensi: budaya militeristik Huawei
  • Ada yang mempertanyakan siapa sebenarnya yang membuat model primitif aslinya
  • Dulu pernah ada anggota Huawei Lab yang benar-benar mengganggu pelatihan model lalu dipecat, dan ada yang curiga apakah itu orang yang sama dengan pelapor kali ini
    • Kemungkinan kasus yang dimaksud adalah insiden magang ByteDance yang menanam malware di model AI lalu dipecat. Artikel terkait: bytedance-intern-fired