Rilis GLM 5.2
(twitter.com/jietang)- GLM-5.2 adalah model open-source yang mendukung konteks 1M yang benar-benar dapat digunakan serta penyelesaian mandiri untuk tugas jangka panjang, dan menyediakan fondasi untuk membangun aplikasi agen yang kompleks
- Di saat akses ke model frontier tiba-tiba diblokir karena alasan nonteknis, sains harus bersifat global dan jalan menuju AGI tidak boleh terjebak di balik hambatan yang tinggi
- AGI bukanlah hak istimewa yang dimonopoli oleh segelintir aturan dan bisa ditarik kapan saja, melainkan harus menjadi fondasi bersama bagi umat manusia untuk bersama-sama menjelajahi batas kecerdasan dan menyelesaikan tugas yang kompleks
- GLM-5.2 adalah model open-source terkuat Zhipu hingga saat ini, dan terus berperan sebagai mesin utama untuk membangun model coding terkuat di negaranya
- Akan lebih dulu tersedia bagi pengguna Lite / Pro / Max dari GLM Coding Plan, dan API dijadwalkan dirilis minggu depan, sehingga akses ke kecerdasan frontier menjadi selangkah lebih dekat
Pesan Utama
- Pembatasan mendadak terhadap model frontier tertentu digambarkan sebagai hal yang sangat disayangkan, dan pada saat akses terputus karena alasan nonteknis, posisi bahwa sains harus bersifat global menjadi semakin kuat
- Jalan menuju AGI tidak boleh dikelilingi hambatan tinggi, dan AGI harus menjadi landasan bagi umat manusia untuk bersama-sama menjelajahi batas kecerdasan dan menyelesaikan tantangan yang kompleks
- AGI tidak boleh menjadi hak istimewa yang dimonopoli oleh segelintir aturan dan bisa dicabut kapan saja; di hadapan pemblokiran dan pembatasan dari luar, dibutuhkan keterbukaan yang radikal
- Kecerdasan frontier harus tetap open-source, mudah diakses, dan dapat dibangun, serta harus tersedia bagi semua pengembang yang berdedikasi
Pengungkapan GLM-5.2 dan Jadwal Ketersediaan
- GLM-5.2 adalah model open-source terkuat yang pernah dirilis Zhipu hingga saat ini
- Model ini mendukung jendela konteks 1M yang benar-benar dapat digunakan, dan terus mempertahankan keunggulan dalam penyelesaian mandiri tugas jangka panjang
- Model ini menyediakan fondasi yang kokoh untuk membuat aplikasi agen yang kompleks, serta terus berperan sebagai mesin utama untuk membangun model coding terkuat di negaranya
- GLM-5.2 akan resmi tersedia pada pukul 5:21 bagi pengguna GLM Coding Plan, dengan cakupan Lite / Pro / Max
- API dijadwalkan dirilis minggu depan, dan ModelKey-nya adalah
GLM-5.2
1 komentar
Komentar Hacker News
Menurut pengumuman pendiri Z.ai, GLM-5.2 adalah model yang “sepenuhnya terbuka”, dan pada saat akses ke sebagian model terdepan tiba-tiba dibatasi karena alasan nonteknis, kecerdasan terdepan seharusnya terbuka untuk semua orang
GLM-5.2 adalah model open-source terkuat Zhipu sejauh ini, dan menonjolkan jendela konteks 1M yang benar-benar dapat digunakan serta kemampuan menjalankan tugas jangka panjang secara mandiri
Disebutkan juga bahwa model ini akan lebih dulu tersedia untuk pengguna Lite / Pro / Max dari GLM Coding Plan, dan API akan dibuka minggu depan
https://x.com/jietang/status/2065784751345287314
Tampaknya berbeda dari model open-weight Tiongkok lain seperti Qwen
Sepertinya belum ada tulisan blog resmi yang memuat hasil benchmark, tetapi sekali lagi terasa patut disyukuri bahwa lembaga AI Tiongkok merilis hasil seperti ini dan berkontribusi ke dunia dengan lisensi permisif
Insiden Fable kembali menunjukkan betapa berharganya model terbuka seperti ini
Meski begitu, tetap sangat mengesankan dan cukup layak dipakai
Untuk arsitektur atau masalah rumit, kelemahannya terlihat jelas, tetapi sepertinya memang tidak banyak orang yang mengharapkan lebih dari itu
Khususnya di sisi desain dan antarmuka pengguna, model ini tampak bekerja lebih baik daripada kelasnya, meski mungkin itu cuma selera pribadi saya
Dalam beberapa hari terakhir, lab Tiongkok merilis MiniMaxM3, KimiK2.7, dan GLM5.2, sementara di saat yang sama AS malah menyensor model
Rasanya hampir seperti membaca novel
Dalam kasus Anthropic saat ini, mungkin memang bisa dibilang AS sedang menyensor model, tetapi rasanya itu lebih cocok dijelaskan sebagai korupsi, balas dendam, pemerasan, dan ketidakmampuan umum dari pemerintahan Trump
Ternyata ini bukan library C++ OpenGL Mathematics yang saya harapkan
Melihat tindakan terbaru pemerintah AS terhadap Fable, arah seperti ini makin terasa seperti masa depan
Tidak bisa bergantung pada produk strategis jika aktornya mudah berubah pikiran dan sewaktu-waktu mengunci pintu
Model open-weight pada dasarnya hampir kebal terhadap situasi seperti itu
Pemerintah AS bisa saja membuat transaksi, pengunduhan, atau penggunaan model open-weight asing menjadi ilegal
Mungkin sulit menegakkannya terhadap individu, tetapi perusahaan pada dasarnya akan patuh, dan jika dilakukan lewat mekanisme sanksi, ada kemungkinan model itu juga akan diturunkan dari hosting berbasis AS seperti GitHub
Selain itu, kita sudah melaju cepat ke tingkat pengawasan massal yang menakutkan, yang juga bisa membantu penegakannya
Situasi Fable menciptakan preseden yang sangat berbahaya, dan saya khawatir tentang masa depan karena tampaknya kita sedang kalah dalam perjuangan demi kebebasan informasi dan komputasi
Pihak yang mendorong omong kosong ini adalah Anthropic
Mereka menurunkan kualitas hasil tanpa pemberitahuan, lalu menolak permintaan atas nama “keamanan”
Bahkan jika pemerintah tidak menyuruh mereka menurunkan model untuk orang asing, keadaan tetap akan sangat buruk karena Anthropic sendiri memang payah
Anthropic merilis ini tepat pada waktu yang sama, pukul 5:21 sore waktu Tiongkok, saat menerima surat larangan Fable dari pemerintah, dan secara eksplisit menyinggung situasi di mana model lain menjadi tidak dapat digunakan
Kelihatannya cukup aneh
Mungkin saja postingannya diedit belakangan
Rilis kali ini terasa seperti dimajukan secara terburu-buru untuk menumpang drama Mythos
Semacam, “sayang ya kamu tidak bisa pakai Fable, tapi coba pakai milik kami selama akhir pekan,” dan mungkin sebenarnya rencananya baru akan dirilis minggu depan sehingga benchmark-nya belum sepenuhnya siap
Saya menunggu rilis 5.2 flash
Meski sudah agak lama, saya masih merasa 4.7 flash adalah salah satu model coding lokal terkuat
Untuk model lokal, Qwen-3.5 masih yang terbaik
3.6 sedikit melewati penggunaan VRAM 24GB, jadi mulai dari titik itu sudah bukan lagi ranah GPU konsumen
Saya berharap ada tulisan blog yang membahas kemampuan model baru ini, apa yang bisa diharapkan, apakah lebih murah, lebih cepat, atau kualitas output-nya lebih baik
Meski begitu, tetap terima kasih sudah merilisnya
Saya penasaran berapa banyak sumber daya komputasi yang sebenarnya dibutuhkan, termasuk kebutuhan untuk berbagai bentuknya, dan apakah ada optimasi seperti TurboQuant, MTP dari Google, atau inovasi internal lain yang membuat kualitas setara frontier secara realistis bisa dihadirkan kepada pengguna lokal
Bukan model lokal dalam arti yang wajar, tetapi karena ini model terbuka, kemungkinan akan muncul beberapa penyedia inferensi pihak ketiga yang bersaing dalam harga per token setelah bobotnya diunggah sekitar seminggu lagi
Tidak ada yang namanya model lokal yang berjalan efektif di hardware konsumen, dan siapa pun yang mengatakan sebaliknya berarti bohong atau berkhayal