7 poin oleh GN⁺ 17 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • Qwen3.6-Plus adalah model upgrade besar yang dirilis setelah Qwen3.5, dengan peningkatan signifikan pada kemampuan coding berbasis agen dan kinerja penalaran multimodal
  • Mendukung jendela konteks 1M token dan dapat langsung digunakan melalui Alibaba Cloud Model Studio API
  • Mencatat performa kelas teratas industri pada benchmark coding, bahasa, multimodal, dan agen, serta meningkatkan kemampuan pengelolaan kode kompleks dan eksekusi rencana jangka panjang
  • Melalui opsi preserve_thinking, model dapat mempertahankan konteks penalaran dan mendukung integrasi dengan berbagai coding agent seperti OpenClaw, Claude Code, dan Qwen Code
  • Berkembang menjadi AI multimodal berbasis agen yang mampu bekerja dari persepsi visual hingga pengambilan tindakan, dengan target jangka panjang berupa open source model kecil dan super agent berotonomi tinggi

Ringkasan fitur utama dan performa Qwen3.6-Plus

  • Qwen3.6-Plus adalah versi upgrade besar yang dirilis setelah seri Qwen3.5, dengan penguatan besar pada kemampuan coding berbasis agen dan kinerja penalaran multimodal
  • Tersedia langsung via API melalui Alibaba Cloud Model Studio, dan secara default menyediakan jendela konteks 1M token
  • Dengan merefleksikan umpan balik komunitas, model ini meningkatkan stabilitas dan keandalan, serta menargetkan pengalaman “vibe coding” di lingkungan pengembangan nyata

Evaluasi performa

  • Mencatat performa terbaik di kelasnya pada berbagai benchmark bahasa, coding, multimodal, dan agen
  • Di bidang coding agent, model ini mencapai hasil yang setara atau melampaui model terdepan industri pada benchmark utama seperti SWE-bench, Terminal-Bench, dan Claw-Eval
  • Pada area agen umum dan pemanfaatan tool, performanya meningkat secara menyeluruh pada TAU3-Bench, DeepPlanning, dan MCPMark
  • Juga mencetak rekor baru pada penalaran STEM, ekstraksi informasi dari teks sangat panjang, dan adaptasi multibahasa
  • Model ini mengintegrasikan penalaran logis, memori, dan eksekusi tool secara organik, sehingga memperkuat kemampuan menyelesaikan masalah dunia nyata seperti pengelolaan kode kompleks dan perencanaan jangka panjang

Performa multimodal

  • Melalui penalaran multimodal tingkat lanjut, model ini membuat kemajuan besar dalam pemahaman dokumen, analisis dunia fisik, penalaran video, dan visual coding
  • Dari sisi penerapan di dunia nyata, model ini menunjukkan performa yang stabil untuk tugas bisnis nyata seperti teks dan pengenalan objek serta persepsi visual presisi tinggi
  • Melalui integrasi vision-language, model ini berkembang melampaui performa tugas tunggal menjadi AI berbasis agen yang berpusat pada workflow
  • Pada berbagai benchmark seperti RealWorldQA, OmniDocBench, CountBench, dan VideoMME, model ini menunjukkan hasil yang kompetitif melawan GPT5.2, Claude 4.5, dan Gemini-3 Pro

API dan integrasi pengembangan

  • Mendukung protokol yang kompatibel dengan OpenAI dan Anthropic melalui Alibaba Cloud Model Studio API
  • Menambahkan opsi API baru preserve_thinking
    • Mempertahankan isi penalaran dari percakapan sebelumnya untuk meningkatkan konsistensi tugas berbasis agen dan efisiensi token
    • Nilai default-nya nonaktif (false), dan saat diaktifkan seluruh konteks penalaran dipertahankan
  • API dapat digunakan melalui endpoint chat.completions yang kompatibel dengan OpenAI, dan disertai contoh kode

Coding dan integrasi agen

  • Qwen3.6-Plus dapat diintegrasikan dengan asisten coding pihak ketiga seperti OpenClaw, Claude Code, Qwen Code, Kilo Code, Cline, dan OpenCode
  • Untuk pengembangan frontend, kemampuannya menangani proyek kompleks seperti adegan 3D, game, dan desain web juga ditingkatkan
  • Integrasi OpenClaw

    • Sebagai AI coding agent open source yang di-self-host, saat dihubungkan ke Model Studio ia menyediakan lingkungan coding berbasis agen berbasis terminal
    • Dapat digunakan dengan menambahkan model Qwen3.6-Plus ke file konfigurasi (openclaw.json)
    • Model ini mendukung reasoning aktif, input teks dan gambar, serta jendela konteks 1M
  • Integrasi Qwen Code

    • AI coding agent terminal open source yang dioptimalkan untuk seri Qwen
    • Mendukung pemahaman codebase kompleks, otomatisasi tugas berulang, dan deployment cepat
    • Setelah instalasi di lingkungan Node.js, autentikasi dapat dilakukan dengan perintah /auth
  • Integrasi Claude Code

    • Berkat kompatibilitas dengan protokol API Anthropic, Qwen3.6-Plus juga dapat digunakan di Claude Code CLI
    • Jalankan setelah mengatur nama model (qwen3.6-plus) dan endpoint API melalui environment variable

Agen visual dan ekspansi multimodal

  • Terus memperkuat jalur perkembangan dari persepsi visual → penalaran multimodal → eksekusi agen
  • Tidak hanya mengenali, tetapi juga mampu melakukan analisis hubungan dalam informasi visual dan pengambilan keputusan tindakan
  • Mendukung tugas visual praktis seperti pemahaman dokumen, analisis grafik, pengenalan UI, dan pelacakan posisi presisi
  • Di area pemahaman video, model ini dapat menangani informasi temporal dan hubungan antar-frame untuk analisis konten dinamis
  • Dalam skenario GUI agent, model ini mengenali status layar dan melakukan perencanaan serta eksekusi multi-tahap

Rencana ke depan

  • Qwen3.6-Plus adalah versi yang menghadirkan kemajuan nyata dalam coding berbasis agen dan AI multimodal, sekaligus memperkuat fondasi ekosistem developer
  • Seluruh seri Qwen3.6 akan segera dirilis, dan model kecil akan di-open source-kan
  • Dalam jangka panjang, targetnya adalah berkembang menjadi super agent berotonomi tinggi yang mampu menangani tugas jangka panjang kompleks pada tingkat repositori

1 komentar

 
GN⁺ 17 hari lalu
Komentar Hacker News
  • Model kali ini khusus hosted sehingga bukan open weight
    Dulu mereka mendapat reputasi baik lewat model terbuka, tetapi sekarang akan sulit beralih agar dianggap sebagai pesaing Claude atau ChatGPT
    Sebenarnya, merilis model kecil secara gratis bukanlah kemurahan hati melainkan strategi iklan
    Selain itu, membandingkannya dengan 4.5 alih-alih Opus 4.6 tampak seperti upaya sengaja untuk menyesatkan
    Meski bukan kelas SOTA, pasar model murah tetap cukup besar
    Hanya saja pasar seperti ini memiliki loyalitas merek yang rendah, jadi begitu ada model yang sedikit lebih baik, orang cenderung langsung pindah

    • Mereka bilang akan merilis “model varian kecil” nanti, tetapi belum ada detailnya
      Bahkan tidak jelas apakah akan ada varian kelas 300B seperti Qwen 3.5. Tidak ada penyebutan juga di blog resmi
    • Ah, jadi itu alasan ada anggota tim Qwen yang keluar belakangan ini
    • Akhir-akhir ini saya justru penasaran dengan profitabilitas model-model seperti ini
      Model terbuka terus bertambah dan bisa berjalan di hardware murah, jadi muncul pertanyaan bagaimana perusahaan AI bisa mempertahankan margin
    • Menurut saya, Opus 4.5 justru lebih baik daripada 4.6
      4.6 hanya pembaruan penghematan biaya, dan benchmark-nya sekadar diutak-atik agar terlihat lebih bagus
    • Setelah memakai banyak model di production, 'kepribadian(personality)' model itu penting
      Misalnya, seberapa baik ia mengikuti instruksi, tidak boros token, dan tidak keluar dari skrip
      Model-model Tiongkok sangat kompetitif di aspek ini, dan menawarkan kualitas mirip dengan harga 70~90% lebih murah
  • Saya paham kenapa Qwen membandingkannya dengan Opus 4.5 atau Gemini Pro 3.0
    Tapi menyebutnya menipu menurut saya berlebihan
    Model AI keluar versi baru tiap kuartal, dan bukan berarti performa generasi sebelumnya langsung terlupakan
    Saya sudah mencoba GLM-5 dan Kimi K2.5, dan keduanya cukup bagus. Jika model Qwen kali ini ada di level itu, itu mengesankan
    Qwen 3.5-plus maupun 3-Max juga sudah merupakan model tertutup sejak sebelumnya, jadi ini bukan pertama kalinya
    Memang disayangkan karena modelnya tertutup, tetapi persaingan menuju SOTA pada akhirnya menguntungkan konsumen

    • Masalahnya bukan sekadar objek pembanding, tetapi ketulusan cara membandingkannya
      Rasanya seperti Apple merilis iPhone baru lalu membandingkannya dengan Android lama, jadi kepercayaannya turun
    • Opus 4.5 sendiri sudah sangat bagus
      Lagipula Opus 4.5 harganya $25 per output token, sedangkan model ini sekitar $6, jadi hanya seperempat harga
  • Saya mendapat hasil Pelican yang lumayan bagus
    Saya membuatnya lewat API Alibaba Cloud Model Studio, dan perlu mendaftarkan akun serta menghubungkan PayPal
    Tetapi sekarang bisa dipakai gratis di OpenRouter

    • Muncul candaan bahwa Pelican sedang mengejar drafting peloton
    • Ada juga candaan bahwa sebentar lagi mereka akan melatih pelican yang bersepeda. Katanya sih “benchmark global”
  • Untuk orang-orang yang mengira lab Tiongkok akan berhenti open source, saya ingin bilang
    Itu sepertinya tidak akan terjadi
    Coba saja daftar ke coding plan Z.ai — hampir mustahil
    Mereka kurang kuat dalam pemasaran, jadi selain merilis model terbuka, mereka nyaris tidak punya cara lain untuk mempertahankan eksistensi
    Penjualan mereka juga bergantung pada kanal distribusi seperti OpenRouter atau OpenCode
    Pada akhirnya, open source bukan strategi negara melainkan satu-satunya cara komersialisasi

    • Ada juga candaan, “kalau begitu kenapa modelnya tidak memasarkan dirinya sendiri?”
      Kalau bahkan promosi diri pun tidak bisa, mungkin itu tanda batas kemampuan performanya
  • Berbeda dari kebanyakan model Qwen, model kali ini bobotnya tidak dibuka, dan jumlah parameternya juga tidak diumumkan
    Selain itu, Opus 4.6 sudah keluar dua bulan lalu, jadi aneh kenapa yang dipakai pembanding justru 4.5

    • Di paragraf terakhir blog, mereka mengatakan akan segera merilis varian model kecil sebagai open source
      Sumber
    • Jika Opus 4.6 dirilis dua bulan lalu, mungkin saja Qwen belum selesai melakukan pengujian perbandingan
    • Sebenarnya model -MAX dan -Omni dari Qwen sejak awal memang tidak dibuka
  • Menurut saya, membandingkannya dengan Opus 4.5 bukan masalah besar
    Justru lebih berguna membandingkannya dengan model yang sudah saya kenal
    Jika saya menginginkan performa terbaik, saya akan memakai model lain, tetapi kalau mencari opsi murah dengan kualitas yang mirip, ini tetap cukup berarti

    • Jika bisa mendapatkan performa setingkat Opus 4.5 secara gratis, itu layak diperhatikan
      Walau tidak dipakai untuk fitur inti aplikasi, tetap cukup berguna untuk bagian yang kurang penting
    • Sejujurnya, Opus 4.6 maupun GPT 5.4 hampir tidak memberi perbedaan yang terasa dibanding generasi sebelumnya
      Jika performa setingkat 4.5 bisa dipakai dengan 1/10 harga, saya akan memilih itu
  • Hasil benchmark agen memang menarik, tetapi saya penasaran seberapa baik kemampuan pemulihan dari kesalahan Qwen3.6-Plus
    Sebagian besar pengujian hanya menangani ‘happy path’,
    padahal yang benar-benar penting adalah apakah ia bisa salah di langkah 3 lalu pulih kembali di langkah 15
    Saya penasaran apakah ada yang sudah melakukan stress test seperti ini dalam workflow pengembangan nyata

  • Saya berharap vendor AI berhenti memakai pemasaran yang membandingkan dengan model generasi lama milik pesaing
    Tidak ada yang tertipu, dan itu cuma mengikis kepercayaan pada merek
    Model Qwen sendiri sangat bagus, jadi sayang reputasinya rusak karena strategi perbandingan seperti ini

  • Sebenarnya sejak dulu Qwen memang menjalankan versi Plus dan Max sebagai model tertutup
    Jadi cara rilis kali ini bukan hal baru

  • Qwen 3.6 Plus tampaknya hanyalah versi yang lebih dipoles dari 3.5 Plus
    Tautan perbandingan