1 poin oleh GN⁺ 3 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • GLM-5.2 adalah model open-source yang mendukung konteks 1M yang benar-benar dapat digunakan serta penyelesaian mandiri untuk tugas jangka panjang, dan menyediakan fondasi untuk membangun aplikasi agen yang kompleks
  • Di saat akses ke model frontier tiba-tiba diblokir karena alasan nonteknis, sains harus bersifat global dan jalan menuju AGI tidak boleh terjebak di balik hambatan yang tinggi
  • AGI bukanlah hak istimewa yang dimonopoli oleh segelintir aturan dan bisa ditarik kapan saja, melainkan harus menjadi fondasi bersama bagi umat manusia untuk bersama-sama menjelajahi batas kecerdasan dan menyelesaikan tugas yang kompleks
  • GLM-5.2 adalah model open-source terkuat Zhipu hingga saat ini, dan terus berperan sebagai mesin utama untuk membangun model coding terkuat di negaranya
  • Akan lebih dulu tersedia bagi pengguna Lite / Pro / Max dari GLM Coding Plan, dan API dijadwalkan dirilis minggu depan, sehingga akses ke kecerdasan frontier menjadi selangkah lebih dekat

Pesan Utama

  • Pembatasan mendadak terhadap model frontier tertentu digambarkan sebagai hal yang sangat disayangkan, dan pada saat akses terputus karena alasan nonteknis, posisi bahwa sains harus bersifat global menjadi semakin kuat
  • Jalan menuju AGI tidak boleh dikelilingi hambatan tinggi, dan AGI harus menjadi landasan bagi umat manusia untuk bersama-sama menjelajahi batas kecerdasan dan menyelesaikan tantangan yang kompleks
  • AGI tidak boleh menjadi hak istimewa yang dimonopoli oleh segelintir aturan dan bisa dicabut kapan saja; di hadapan pemblokiran dan pembatasan dari luar, dibutuhkan keterbukaan yang radikal
  • Kecerdasan frontier harus tetap open-source, mudah diakses, dan dapat dibangun, serta harus tersedia bagi semua pengembang yang berdedikasi

Pengungkapan GLM-5.2 dan Jadwal Ketersediaan

  • GLM-5.2 adalah model open-source terkuat yang pernah dirilis Zhipu hingga saat ini
  • Model ini mendukung jendela konteks 1M yang benar-benar dapat digunakan, dan terus mempertahankan keunggulan dalam penyelesaian mandiri tugas jangka panjang
  • Model ini menyediakan fondasi yang kokoh untuk membuat aplikasi agen yang kompleks, serta terus berperan sebagai mesin utama untuk membangun model coding terkuat di negaranya
  • GLM-5.2 akan resmi tersedia pada pukul 5:21 bagi pengguna GLM Coding Plan, dengan cakupan Lite / Pro / Max
  • API dijadwalkan dirilis minggu depan, dan ModelKey-nya adalah GLM-5.2

1 komentar

 
GN⁺ 3 jam lalu
Komentar Hacker News
  • Menurut pengumuman pendiri Z.ai, GLM-5.2 adalah model yang “sepenuhnya terbuka”, dan pada saat akses ke sebagian model terdepan tiba-tiba dibatasi karena alasan nonteknis, kecerdasan terdepan seharusnya terbuka untuk semua orang
    GLM-5.2 adalah model open-source terkuat Zhipu sejauh ini, dan menonjolkan jendela konteks 1M yang benar-benar dapat digunakan serta kemampuan menjalankan tugas jangka panjang secara mandiri
    Disebutkan juga bahwa model ini akan lebih dulu tersedia untuk pengguna Lite / Pro / Max dari GLM Coding Plan, dan API akan dibuka minggu depan
    https://x.com/jietang/status/2065784751345287314

    • Hal yang bagus dari GLM adalah saat digunakan di OpenRouter, model ini bisa difilter dengan syarat penyedia berbasis di AS dan tanpa retensi data
      Tampaknya berbeda dari model open-weight Tiongkok lain seperti Qwen
    • Saya penasaran apakah “GLM-5.2 is Fully Open” hanya berarti open weight, atau benar-benar mencakup sumber dan data juga
  • Sepertinya belum ada tulisan blog resmi yang memuat hasil benchmark, tetapi sekali lagi terasa patut disyukuri bahwa lembaga AI Tiongkok merilis hasil seperti ini dan berkontribusi ke dunia dengan lisensi permisif
    Insiden Fable kembali menunjukkan betapa berharganya model terbuka seperti ini

    • Kesan pertama saya, model ini terlihat sekitar 6 bulan tertinggal dari lab terdepan, dan rasanya mirip Opus pada bulan Januari
      Meski begitu, tetap sangat mengesankan dan cukup layak dipakai
      Untuk arsitektur atau masalah rumit, kelemahannya terlihat jelas, tetapi sepertinya memang tidak banyak orang yang mengharapkan lebih dari itu
      Khususnya di sisi desain dan antarmuka pengguna, model ini tampak bekerja lebih baik daripada kelasnya, meski mungkin itu cuma selera pribadi saya
    • Merilis model tanpa benchmark terlihat seperti sinyal bahwa modelnya mungkin memang kurang bagus
  • Dalam beberapa hari terakhir, lab Tiongkok merilis MiniMaxM3, KimiK2.7, dan GLM5.2, sementara di saat yang sama AS malah menyensor model
    Rasanya hampir seperti membaca novel

    • Saya penasaran bagaimana kimi2.7 dibandingkan dengan GLM5.2
    • Model Tiongkok juga disensor
      Dalam kasus Anthropic saat ini, mungkin memang bisa dibilang AS sedang menyensor model, tetapi rasanya itu lebih cocok dijelaskan sebagai korupsi, balas dendam, pemerasan, dan ketidakmampuan umum dari pemerintahan Trump
  • Ternyata ini bukan library C++ OpenGL Mathematics yang saya harapkan

  • Melihat tindakan terbaru pemerintah AS terhadap Fable, arah seperti ini makin terasa seperti masa depan
    Tidak bisa bergantung pada produk strategis jika aktornya mudah berubah pikiran dan sewaktu-waktu mengunci pintu
    Model open-weight pada dasarnya hampir kebal terhadap situasi seperti itu

    • Itu hanya benar sampai batas tertentu
      Pemerintah AS bisa saja membuat transaksi, pengunduhan, atau penggunaan model open-weight asing menjadi ilegal
      Mungkin sulit menegakkannya terhadap individu, tetapi perusahaan pada dasarnya akan patuh, dan jika dilakukan lewat mekanisme sanksi, ada kemungkinan model itu juga akan diturunkan dari hosting berbasis AS seperti GitHub
      Selain itu, kita sudah melaju cepat ke tingkat pengawasan massal yang menakutkan, yang juga bisa membantu penegakannya
      Situasi Fable menciptakan preseden yang sangat berbahaya, dan saya khawatir tentang masa depan karena tampaknya kita sedang kalah dalam perjuangan demi kebebasan informasi dan komputasi
    • Ada kemungkinan sangat besar Tiongkok juga akan beralih menjadi tertutup begitu mereka setara atau mulai unggul
    • Mengkritik pemerintah mungkin memang tepat, tetapi Anthropic juga tidak boleh lolos begitu saja
      Pihak yang mendorong omong kosong ini adalah Anthropic
      Mereka menurunkan kualitas hasil tanpa pemberitahuan, lalu menolak permintaan atas nama “keamanan”
      Bahkan jika pemerintah tidak menyuruh mereka menurunkan model untuk orang asing, keadaan tetap akan sangat buruk karena Anthropic sendiri memang payah
  • Anthropic merilis ini tepat pada waktu yang sama, pukul 5:21 sore waktu Tiongkok, saat menerima surat larangan Fable dari pemerintah, dan secara eksplisit menyinggung situasi di mana model lain menjadi tidak dapat digunakan

    • Benarkah begitu? Saya tidak yakin soal zona waktunya
      Kelihatannya cukup aneh
      Mungkin saja postingannya diedit belakangan
  • Rilis kali ini terasa seperti dimajukan secara terburu-buru untuk menumpang drama Mythos
    Semacam, “sayang ya kamu tidak bisa pakai Fable, tapi coba pakai milik kami selama akhir pekan,” dan mungkin sebenarnya rencananya baru akan dirilis minggu depan sehingga benchmark-nya belum sepenuhnya siap

  • Saya menunggu rilis 5.2 flash
    Meski sudah agak lama, saya masih merasa 4.7 flash adalah salah satu model coding lokal terkuat

    • Sepertinya saya melihat ada pernyataan bahwa tidak akan ada flash
    • Serius? 4.7-flash buat saya cukup mengerikan
      Untuk model lokal, Qwen-3.5 masih yang terbaik
      3.6 sedikit melewati penggunaan VRAM 24GB, jadi mulai dari titik itu sudah bukan lagi ranah GPU konsumen
  • Saya berharap ada tulisan blog yang membahas kemampuan model baru ini, apa yang bisa diharapkan, apakah lebih murah, lebih cepat, atau kualitas output-nya lebih baik
    Meski begitu, tetap terima kasih sudah merilisnya

    • Mungkin lebih baik tunggu sampai hari Senin
  • Saya penasaran berapa banyak sumber daya komputasi yang sebenarnya dibutuhkan, termasuk kebutuhan untuk berbagai bentuknya, dan apakah ada optimasi seperti TurboQuant, MTP dari Google, atau inovasi internal lain yang membuat kualitas setara frontier secara realistis bisa dihadirkan kepada pengguna lokal

    • Seri GLM-5 adalah 744B-A40B
      Bukan model lokal dalam arti yang wajar, tetapi karena ini model terbuka, kemungkinan akan muncul beberapa penyedia inferensi pihak ketiga yang bersaing dalam harga per token setelah bobotnya diunggah sekitar seminggu lagi
    • Kalau menghabiskan 80 ribu dolar untuk hardware, Anda bisa menjalankannya
      Tidak ada yang namanya model lokal yang berjalan efektif di hardware konsumen, dan siapa pun yang mengatakan sebaliknya berarti bohong atau berkhayal