- Qwen3.6-Plus adalah model upgrade besar yang dirilis setelah Qwen3.5, dengan peningkatan signifikan pada kemampuan coding berbasis agen dan kinerja penalaran multimodal
- Mendukung jendela konteks 1M token dan dapat langsung digunakan melalui Alibaba Cloud Model Studio API
- Mencatat performa kelas teratas industri pada benchmark coding, bahasa, multimodal, dan agen, serta meningkatkan kemampuan pengelolaan kode kompleks dan eksekusi rencana jangka panjang
- Melalui opsi preserve_thinking, model dapat mempertahankan konteks penalaran dan mendukung integrasi dengan berbagai coding agent seperti OpenClaw, Claude Code, dan Qwen Code
- Berkembang menjadi AI multimodal berbasis agen yang mampu bekerja dari persepsi visual hingga pengambilan tindakan, dengan target jangka panjang berupa open source model kecil dan super agent berotonomi tinggi
Ringkasan fitur utama dan performa Qwen3.6-Plus
- Qwen3.6-Plus adalah versi upgrade besar yang dirilis setelah seri Qwen3.5, dengan penguatan besar pada kemampuan coding berbasis agen dan kinerja penalaran multimodal
- Tersedia langsung via API melalui Alibaba Cloud Model Studio, dan secara default menyediakan jendela konteks 1M token
- Dengan merefleksikan umpan balik komunitas, model ini meningkatkan stabilitas dan keandalan, serta menargetkan pengalaman “vibe coding” di lingkungan pengembangan nyata
Evaluasi performa
- Mencatat performa terbaik di kelasnya pada berbagai benchmark bahasa, coding, multimodal, dan agen
- Di bidang coding agent, model ini mencapai hasil yang setara atau melampaui model terdepan industri pada benchmark utama seperti SWE-bench, Terminal-Bench, dan Claw-Eval
- Pada area agen umum dan pemanfaatan tool, performanya meningkat secara menyeluruh pada TAU3-Bench, DeepPlanning, dan MCPMark
- Juga mencetak rekor baru pada penalaran STEM, ekstraksi informasi dari teks sangat panjang, dan adaptasi multibahasa
- Model ini mengintegrasikan penalaran logis, memori, dan eksekusi tool secara organik, sehingga memperkuat kemampuan menyelesaikan masalah dunia nyata seperti pengelolaan kode kompleks dan perencanaan jangka panjang
Performa multimodal
- Melalui penalaran multimodal tingkat lanjut, model ini membuat kemajuan besar dalam pemahaman dokumen, analisis dunia fisik, penalaran video, dan visual coding
- Dari sisi penerapan di dunia nyata, model ini menunjukkan performa yang stabil untuk tugas bisnis nyata seperti teks dan pengenalan objek serta persepsi visual presisi tinggi
- Melalui integrasi vision-language, model ini berkembang melampaui performa tugas tunggal menjadi AI berbasis agen yang berpusat pada workflow
- Pada berbagai benchmark seperti RealWorldQA, OmniDocBench, CountBench, dan VideoMME, model ini menunjukkan hasil yang kompetitif melawan GPT5.2, Claude 4.5, dan Gemini-3 Pro
API dan integrasi pengembangan
- Mendukung protokol yang kompatibel dengan OpenAI dan Anthropic melalui Alibaba Cloud Model Studio API
- Menambahkan opsi API baru
preserve_thinking
- Mempertahankan isi penalaran dari percakapan sebelumnya untuk meningkatkan konsistensi tugas berbasis agen dan efisiensi token
- Nilai default-nya nonaktif (
false), dan saat diaktifkan seluruh konteks penalaran dipertahankan
- API dapat digunakan melalui endpoint
chat.completions yang kompatibel dengan OpenAI, dan disertai contoh kode
Coding dan integrasi agen
- Qwen3.6-Plus dapat diintegrasikan dengan asisten coding pihak ketiga seperti OpenClaw, Claude Code, Qwen Code, Kilo Code, Cline, dan OpenCode
- Untuk pengembangan frontend, kemampuannya menangani proyek kompleks seperti adegan 3D, game, dan desain web juga ditingkatkan
-
Integrasi OpenClaw
- Sebagai AI coding agent open source yang di-self-host, saat dihubungkan ke Model Studio ia menyediakan lingkungan coding berbasis agen berbasis terminal
- Dapat digunakan dengan menambahkan model Qwen3.6-Plus ke file konfigurasi (
openclaw.json)
- Model ini mendukung reasoning aktif, input teks dan gambar, serta jendela konteks 1M
-
Integrasi Qwen Code
- AI coding agent terminal open source yang dioptimalkan untuk seri Qwen
- Mendukung pemahaman codebase kompleks, otomatisasi tugas berulang, dan deployment cepat
- Setelah instalasi di lingkungan Node.js, autentikasi dapat dilakukan dengan perintah
/auth
-
Integrasi Claude Code
- Berkat kompatibilitas dengan protokol API Anthropic, Qwen3.6-Plus juga dapat digunakan di Claude Code CLI
- Jalankan setelah mengatur nama model (
qwen3.6-plus) dan endpoint API melalui environment variable
Agen visual dan ekspansi multimodal
- Terus memperkuat jalur perkembangan dari persepsi visual → penalaran multimodal → eksekusi agen
- Tidak hanya mengenali, tetapi juga mampu melakukan analisis hubungan dalam informasi visual dan pengambilan keputusan tindakan
- Mendukung tugas visual praktis seperti pemahaman dokumen, analisis grafik, pengenalan UI, dan pelacakan posisi presisi
- Di area pemahaman video, model ini dapat menangani informasi temporal dan hubungan antar-frame untuk analisis konten dinamis
- Dalam skenario GUI agent, model ini mengenali status layar dan melakukan perencanaan serta eksekusi multi-tahap
Rencana ke depan
- Qwen3.6-Plus adalah versi yang menghadirkan kemajuan nyata dalam coding berbasis agen dan AI multimodal, sekaligus memperkuat fondasi ekosistem developer
- Seluruh seri Qwen3.6 akan segera dirilis, dan model kecil akan di-open source-kan
- Dalam jangka panjang, targetnya adalah berkembang menjadi super agent berotonomi tinggi yang mampu menangani tugas jangka panjang kompleks pada tingkat repositori
1 komentar
Komentar Hacker News
Model kali ini khusus hosted sehingga bukan open weight
Dulu mereka mendapat reputasi baik lewat model terbuka, tetapi sekarang akan sulit beralih agar dianggap sebagai pesaing Claude atau ChatGPT
Sebenarnya, merilis model kecil secara gratis bukanlah kemurahan hati melainkan strategi iklan
Selain itu, membandingkannya dengan 4.5 alih-alih Opus 4.6 tampak seperti upaya sengaja untuk menyesatkan
Meski bukan kelas SOTA, pasar model murah tetap cukup besar
Hanya saja pasar seperti ini memiliki loyalitas merek yang rendah, jadi begitu ada model yang sedikit lebih baik, orang cenderung langsung pindah
Bahkan tidak jelas apakah akan ada varian kelas 300B seperti Qwen 3.5. Tidak ada penyebutan juga di blog resmi
Model terbuka terus bertambah dan bisa berjalan di hardware murah, jadi muncul pertanyaan bagaimana perusahaan AI bisa mempertahankan margin
4.6 hanya pembaruan penghematan biaya, dan benchmark-nya sekadar diutak-atik agar terlihat lebih bagus
Misalnya, seberapa baik ia mengikuti instruksi, tidak boros token, dan tidak keluar dari skrip
Model-model Tiongkok sangat kompetitif di aspek ini, dan menawarkan kualitas mirip dengan harga 70~90% lebih murah
Saya paham kenapa Qwen membandingkannya dengan Opus 4.5 atau Gemini Pro 3.0
Tapi menyebutnya menipu menurut saya berlebihan
Model AI keluar versi baru tiap kuartal, dan bukan berarti performa generasi sebelumnya langsung terlupakan
Saya sudah mencoba GLM-5 dan Kimi K2.5, dan keduanya cukup bagus. Jika model Qwen kali ini ada di level itu, itu mengesankan
Qwen 3.5-plus maupun 3-Max juga sudah merupakan model tertutup sejak sebelumnya, jadi ini bukan pertama kalinya
Memang disayangkan karena modelnya tertutup, tetapi persaingan menuju SOTA pada akhirnya menguntungkan konsumen
Rasanya seperti Apple merilis iPhone baru lalu membandingkannya dengan Android lama, jadi kepercayaannya turun
Lagipula Opus 4.5 harganya $25 per output token, sedangkan model ini sekitar $6, jadi hanya seperempat harga
Saya mendapat hasil Pelican yang lumayan bagus
Saya membuatnya lewat API Alibaba Cloud Model Studio, dan perlu mendaftarkan akun serta menghubungkan PayPal
Tetapi sekarang bisa dipakai gratis di OpenRouter
Untuk orang-orang yang mengira lab Tiongkok akan berhenti open source, saya ingin bilang
Itu sepertinya tidak akan terjadi
Coba saja daftar ke coding plan Z.ai — hampir mustahil
Mereka kurang kuat dalam pemasaran, jadi selain merilis model terbuka, mereka nyaris tidak punya cara lain untuk mempertahankan eksistensi
Penjualan mereka juga bergantung pada kanal distribusi seperti OpenRouter atau OpenCode
Pada akhirnya, open source bukan strategi negara melainkan satu-satunya cara komersialisasi
Kalau bahkan promosi diri pun tidak bisa, mungkin itu tanda batas kemampuan performanya
Berbeda dari kebanyakan model Qwen, model kali ini bobotnya tidak dibuka, dan jumlah parameternya juga tidak diumumkan
Selain itu, Opus 4.6 sudah keluar dua bulan lalu, jadi aneh kenapa yang dipakai pembanding justru 4.5
Sumber
Menurut saya, membandingkannya dengan Opus 4.5 bukan masalah besar
Justru lebih berguna membandingkannya dengan model yang sudah saya kenal
Jika saya menginginkan performa terbaik, saya akan memakai model lain, tetapi kalau mencari opsi murah dengan kualitas yang mirip, ini tetap cukup berarti
Walau tidak dipakai untuk fitur inti aplikasi, tetap cukup berguna untuk bagian yang kurang penting
Jika performa setingkat 4.5 bisa dipakai dengan 1/10 harga, saya akan memilih itu
Hasil benchmark agen memang menarik, tetapi saya penasaran seberapa baik kemampuan pemulihan dari kesalahan Qwen3.6-Plus
Sebagian besar pengujian hanya menangani ‘happy path’,
padahal yang benar-benar penting adalah apakah ia bisa salah di langkah 3 lalu pulih kembali di langkah 15
Saya penasaran apakah ada yang sudah melakukan stress test seperti ini dalam workflow pengembangan nyata
Saya berharap vendor AI berhenti memakai pemasaran yang membandingkan dengan model generasi lama milik pesaing
Tidak ada yang tertipu, dan itu cuma mengikis kepercayaan pada merek
Model Qwen sendiri sangat bagus, jadi sayang reputasinya rusak karena strategi perbandingan seperti ini
Sebenarnya sejak dulu Qwen memang menjalankan versi Plus dan Max sebagai model tertutup
Jadi cara rilis kali ini bukan hal baru
Qwen 3.6 Plus tampaknya hanyalah versi yang lebih dipoles dari 3.5 Plus
Tautan perbandingan