- Huawei menghadapi tuduhan dari pelapor internal bahwa perusahaan menyalin model AI besar dari Qwen dan DeepSeek lalu menampilkannya sebagai produk internal bernama ‘Pangu’
- Menurut kesaksian karyawan internal tim Pangu, sebagian model yang substantif bukan dikembangkan sendiri, melainkan hanya berganti nama dari model open source eksternal
- Secara teknis terungkap bahwa model utama seperti 135B V2 dan Pro MoE 72B memiliki tingkat kesamaan yang tinggi dengan arsitektur Qwen dan DeepSeek
- Di internal, praktik ini disebut telah menyebabkan moral peneliti merosot dan banyak yang hengkang, sementara inefisiensi administratif dan kebijakan SDM yang tidak transparan memperparah masalah
- Meski ada juga model yang benar-benar dikembangkan secara mandiri (seperti Pangu V3), budaya penyalinan dan minimnya pengakuan terhadap riset meninggalkan luka besar pada kepercayaan organisasi secara keseluruhan
- Pelapor internal menyatakan dirinya memutuskan mengungkap kebenaran dengan identitas asli dan mendesak organisasi untuk berefleksi serta berubah
Tragedi Pangu: Sisi Dalam yang Menyakitkan dari Model Besar Pangu milik Huawei Noah Ark Lab
Perkenalan pelapor internal dan suasana di lapangan
- Penulis merupakan anggota tim model besar Huawei Noah Pangu, dan memverifikasi identitasnya dengan mencocokkan struktur organisasi-proyek utama serta susunan kepemimpinan dengan informasi internal
- Proyek Pangu pada praktiknya lebih mirip organisasi pengiriman daripada organisasi riset, dan terus dibebani tenggat berulang, kerja berlebihan, serta tekanan evaluasi dan pelaporan yang tak henti-hentinya
- Intensitas kerja dan birokrasi sangat ekstrem, dengan kondisi tinggal lama terpisah dari keluarga di akomodasi perusahaan serta kerja akhir pekan yang kerap terjadi
- Pada kenyataannya, budaya perusahaan lebih didominasi fokus pada tenggat dan kinerja tiap lini produk (Cloud, ICT, dll.) ketimbang otonomi dan kreativitas riset
Malam tanpa tidur, kesadaran berkarya yang diinjak-injak
- Setelah kontroversi plagiarisme model Qwen, sebagian peneliti mengalami rasa malu, marah, dan tak berdaya secara bersamaan
- Pelapor sendiri takut pada pembalasan dari korporasi besar dan jaringan internal, tetapi memutuskan berbicara menurut hati nurani karena tidak lagi mampu menoleransi penutupan fakta dan promosi eksternal yang penuh kebohongan
Hambatan teknis dan awal mula plagiarisme
- Pada tahap awal, model Pangu mencoba dilatih sendiri di atas NPU Ascend milik Huawei, tetapi mengalami trial and error serius seperti efisiensi tokenizer yang buruk dan performa model yang lemah
- Mereka tertinggal dari model berbasis GPU milik pesaing (Alibaba, Zhipu), dan pelatihan model dense 230B buatan sendiri berakhir gagal
- Karena itu, lab model kecil membungkusnya sebagai “pengembangan internal”, padahal sebenarnya membuat 135B V2 dengan mengkloning dan sedikit memodifikasi model Qwen-1.5 (110B) untuk dipasok, dan kemiripan kode serta struktur juga terlihat di internal
- Pimpinan utama dan manajemen mengetahui kenyataan ini, namun membiarkannya demi tekanan capaian dan hasil eksternal
Pencapaian teknis yang sesungguhnya: Pangu V3
- Setelah berjuang keras, tim akhirnya melatih model Pangu V3 (135B Ultra) yang sepenuhnya dikembangkan sendiri dari awal secara independen di Ascend
- Dengan mengatasi berbagai hambatan teknis seperti penyatuan tokenizer dan stabilisasi kurva loss, tim berhasil mencapai performa yang sebanding dengan pesaing
- Pencapaian ini menjadi bukti pengembangan model besar yang orisinal, bukan hasil plagiarisme, dan menjadi sumber kebanggaan para peneliti
Kerja keras yang tak diakui di balik pembagian kerja
- Lab model kecil terus-menerus mengambil data, kode, dan hasil kerja lalu dengan mudah memodifikasi/menyebarkan model, sementara pencapaian dan penghargaan sebagian besar jatuh ke organisasi tersebut
- Akibatnya, para peneliti yang berdedikasi secara getir mengungkapkan bahwa mereka akhirnya keluar dari organisasi atau meninggalkan noda dalam perjalanan karier teknis mereka
Kasus plagiarisme kedua seperti klon 224B MoE/718B
- Dalam proses pengembangan model MoE 718B yang baru, DeepSeekv3 juga disebut hampir disalin mentah-mentah lalu dinamai Pangu Pro MoE 72B dan didistribusikan
- Di internal, praktik semacam ini diketahui, tetapi suasananya cenderung ditutup-tutupi karena ketakutan akan kelangsungan hidup masing-masing dan kebenaran yang terungkap
Manajemen administratif yang tidak masuk akal
- Bagi peneliti yang benar-benar melakukan riset, diterapkan proses, silsilah model, dan sistem audit yang ketat sehingga kecepatan pengembangan melambat
- Namun untuk model hasil kloning, standar ganda yang mengakar tetap berlaku: “kalau dari atas, semuanya lolos”
Alasan pengungkapan dan keputusan untuk mundur
- Setelah insiden HonestAGI, upaya manajemen krisis tingkat perusahaan dan penutupan internal mulai dijalankan
- Pelapor menyatakan tidak lagi bisa ikut serta dalam “laporan palsu” dan kolusi internal, serta mengungkap niat untuk menghapus namanya dari daftar anggota tim dan laporan, lalu mengundurkan diri secara sukarela
Seruan terakhir dan rasa sayang pada rekan-rekan
- Rekan-rekan sudah banyak pindah ke perusahaan lain seperti ByteDance, DeepSeek, Tencent, dan Kuaishou, yang menunjukkan arus keluar talenta Huawei sudah sangat serius
- Ia menegaskan bahwa dengan inovasi, lingkungan yang tepat, dan hambatan politik yang lebih sedikit, pengembangan model besar dan chip kelas dunia pun sebenarnya mungkin dicapai
- Ia juga menyatakan kesediaan menanggung risiko atas kebenaran isi ini, termasuk kemungkinan ancaman terhadap keselamatan dirinya dan keluarganya akibat pengungkapan tambahan
Penjelasan situasi tambahan
- Dalam kasus klon 135B V2, lab model kecil hanya mengambil manfaat seperti penghargaan dan insentif, sementara beban dukungan downstream dan pemeliharaan dialihkan ke tim pengembang asli (4th brigade)
- Bahkan dalam pencantuman penulis laporan teknis Pangu, praktik akademik yang tidak adil disebut merajalela: orang yang memberi kontribusi kunci pada pengembangan model justru dikeluarkan, sementara orang nonkontributor dari lab model kecil dimasukkan
1 komentar
Komentar Hacker News