Qwen3.6-Plus: Menuju agen dunia nyata

(qwen.ai)

7 poin oleh GN⁺ 2026-04-03 | 1 komentar | Bagikan ke WhatsApp

Qwen3.6-Plus adalah model upgrade besar yang dirilis setelah Qwen3.5, dengan peningkatan signifikan pada kemampuan coding berbasis agen dan kinerja penalaran multimodal
Mendukung jendela konteks 1M token dan dapat langsung digunakan melalui Alibaba Cloud Model Studio API
Mencatat performa kelas teratas industri pada benchmark coding, bahasa, multimodal, dan agen, serta meningkatkan kemampuan pengelolaan kode kompleks dan eksekusi rencana jangka panjang
Melalui opsi preserve_thinking, model dapat mempertahankan konteks penalaran dan mendukung integrasi dengan berbagai coding agent seperti OpenClaw, Claude Code, dan Qwen Code
Berkembang menjadi AI multimodal berbasis agen yang mampu bekerja dari persepsi visual hingga pengambilan tindakan, dengan target jangka panjang berupa open source model kecil dan super agent berotonomi tinggi

Ringkasan fitur utama dan performa Qwen3.6-Plus

Qwen3.6-Plus adalah versi upgrade besar yang dirilis setelah seri Qwen3.5, dengan penguatan besar pada kemampuan coding berbasis agen dan kinerja penalaran multimodal
Tersedia langsung via API melalui Alibaba Cloud Model Studio, dan secara default menyediakan jendela konteks 1M token
Dengan merefleksikan umpan balik komunitas, model ini meningkatkan stabilitas dan keandalan, serta menargetkan pengalaman “vibe coding” di lingkungan pengembangan nyata

Evaluasi performa

Mencatat performa terbaik di kelasnya pada berbagai benchmark bahasa, coding, multimodal, dan agen
Di bidang coding agent, model ini mencapai hasil yang setara atau melampaui model terdepan industri pada benchmark utama seperti SWE-bench, Terminal-Bench, dan Claw-Eval
Pada area agen umum dan pemanfaatan tool, performanya meningkat secara menyeluruh pada TAU3-Bench, DeepPlanning, dan MCPMark
Juga mencetak rekor baru pada penalaran STEM, ekstraksi informasi dari teks sangat panjang, dan adaptasi multibahasa
Model ini mengintegrasikan penalaran logis, memori, dan eksekusi tool secara organik, sehingga memperkuat kemampuan menyelesaikan masalah dunia nyata seperti pengelolaan kode kompleks dan perencanaan jangka panjang

Performa multimodal

Melalui penalaran multimodal tingkat lanjut, model ini membuat kemajuan besar dalam pemahaman dokumen, analisis dunia fisik, penalaran video, dan visual coding
Dari sisi penerapan di dunia nyata, model ini menunjukkan performa yang stabil untuk tugas bisnis nyata seperti teks dan pengenalan objek serta persepsi visual presisi tinggi
Melalui integrasi vision-language, model ini berkembang melampaui performa tugas tunggal menjadi AI berbasis agen yang berpusat pada workflow
Pada berbagai benchmark seperti RealWorldQA, OmniDocBench, CountBench, dan VideoMME, model ini menunjukkan hasil yang kompetitif melawan GPT5.2, Claude 4.5, dan Gemini-3 Pro

API dan integrasi pengembangan

Mendukung protokol yang kompatibel dengan OpenAI dan Anthropic melalui Alibaba Cloud Model Studio API
Menambahkan opsi API baru preserve_thinking
- Mempertahankan isi penalaran dari percakapan sebelumnya untuk meningkatkan konsistensi tugas berbasis agen dan efisiensi token
- Nilai default-nya nonaktif (false), dan saat diaktifkan seluruh konteks penalaran dipertahankan
API dapat digunakan melalui endpoint chat.completions yang kompatibel dengan OpenAI, dan disertai contoh kode

Coding dan integrasi agen

Qwen3.6-Plus dapat diintegrasikan dengan asisten coding pihak ketiga seperti OpenClaw, Claude Code, Qwen Code, Kilo Code, Cline, dan OpenCode
Untuk pengembangan frontend, kemampuannya menangani proyek kompleks seperti adegan 3D, game, dan desain web juga ditingkatkan
Integrasi OpenClaw
- Sebagai AI coding agent open source yang di-self-host, saat dihubungkan ke Model Studio ia menyediakan lingkungan coding berbasis agen berbasis terminal
- Dapat digunakan dengan menambahkan model Qwen3.6-Plus ke file konfigurasi (openclaw.json)
- Model ini mendukung reasoning aktif, input teks dan gambar, serta jendela konteks 1M
Integrasi Qwen Code
- AI coding agent terminal open source yang dioptimalkan untuk seri Qwen
- Mendukung pemahaman codebase kompleks, otomatisasi tugas berulang, dan deployment cepat
- Setelah instalasi di lingkungan Node.js, autentikasi dapat dilakukan dengan perintah /auth
Integrasi Claude Code
- Berkat kompatibilitas dengan protokol API Anthropic, Qwen3.6-Plus juga dapat digunakan di Claude Code CLI
- Jalankan setelah mengatur nama model (qwen3.6-plus) dan endpoint API melalui environment variable

Agen visual dan ekspansi multimodal

Terus memperkuat jalur perkembangan dari persepsi visual → penalaran multimodal → eksekusi agen
Tidak hanya mengenali, tetapi juga mampu melakukan analisis hubungan dalam informasi visual dan pengambilan keputusan tindakan
Mendukung tugas visual praktis seperti pemahaman dokumen, analisis grafik, pengenalan UI, dan pelacakan posisi presisi
Di area pemahaman video, model ini dapat menangani informasi temporal dan hubungan antar-frame untuk analisis konten dinamis
Dalam skenario GUI agent, model ini mengenali status layar dan melakukan perencanaan serta eksekusi multi-tahap

Rencana ke depan

Qwen3.6-Plus adalah versi yang menghadirkan kemajuan nyata dalam coding berbasis agen dan AI multimodal, sekaligus memperkuat fondasi ekosistem developer
Seluruh seri Qwen3.6 akan segera dirilis, dan model kecil akan di-open source-kan
Dalam jangka panjang, targetnya adalah berkembang menjadi super agent berotonomi tinggi yang mampu menangani tugas jangka panjang kompleks pada tingkat repositori

1 komentar

GN⁺ 2026-04-03

Komentar Hacker News

Model kali ini khusus hosted sehingga bukan open weight
Dulu mereka mendapat reputasi baik lewat model terbuka, tetapi sekarang akan sulit beralih agar dianggap sebagai pesaing Claude atau ChatGPT
Sebenarnya, merilis model kecil secara gratis bukanlah kemurahan hati melainkan strategi iklan
Selain itu, membandingkannya dengan 4.5 alih-alih Opus 4.6 tampak seperti upaya sengaja untuk menyesatkan
Meski bukan kelas SOTA, pasar model murah tetap cukup besar
Hanya saja pasar seperti ini memiliki loyalitas merek yang rendah, jadi begitu ada model yang sedikit lebih baik, orang cenderung langsung pindah
- Mereka bilang akan merilis “model varian kecil” nanti, tetapi belum ada detailnya
  Bahkan tidak jelas apakah akan ada varian kelas 300B seperti Qwen 3.5. Tidak ada penyebutan juga di blog resmi
- Ah, jadi itu alasan ada anggota tim Qwen yang keluar belakangan ini
- Akhir-akhir ini saya justru penasaran dengan profitabilitas model-model seperti ini
  Model terbuka terus bertambah dan bisa berjalan di hardware murah, jadi muncul pertanyaan bagaimana perusahaan AI bisa mempertahankan margin
- Menurut saya, Opus 4.5 justru lebih baik daripada 4.6
  4.6 hanya pembaruan penghematan biaya, dan benchmark-nya sekadar diutak-atik agar terlihat lebih bagus
- Setelah memakai banyak model di production, 'kepribadian(personality)' model itu penting
  Misalnya, seberapa baik ia mengikuti instruksi, tidak boros token, dan tidak keluar dari skrip
  Model-model Tiongkok sangat kompetitif di aspek ini, dan menawarkan kualitas mirip dengan harga 70~90% lebih murah
Saya paham kenapa Qwen membandingkannya dengan Opus 4.5 atau Gemini Pro 3.0
Tapi menyebutnya menipu menurut saya berlebihan
Model AI keluar versi baru tiap kuartal, dan bukan berarti performa generasi sebelumnya langsung terlupakan
Saya sudah mencoba GLM-5 dan Kimi K2.5, dan keduanya cukup bagus. Jika model Qwen kali ini ada di level itu, itu mengesankan
Qwen 3.5-plus maupun 3-Max juga sudah merupakan model tertutup sejak sebelumnya, jadi ini bukan pertama kalinya
Memang disayangkan karena modelnya tertutup, tetapi persaingan menuju SOTA pada akhirnya menguntungkan konsumen
- Masalahnya bukan sekadar objek pembanding, tetapi ketulusan cara membandingkannya
  Rasanya seperti Apple merilis iPhone baru lalu membandingkannya dengan Android lama, jadi kepercayaannya turun
- Opus 4.5 sendiri sudah sangat bagus
  Lagipula Opus 4.5 harganya $25 per output token, sedangkan model ini sekitar $6, jadi hanya seperempat harga
Saya mendapat hasil Pelican yang lumayan bagus
Saya membuatnya lewat API Alibaba Cloud Model Studio, dan perlu mendaftarkan akun serta menghubungkan PayPal
Tetapi sekarang bisa dipakai gratis di OpenRouter
- Muncul candaan bahwa Pelican sedang mengejar drafting peloton
- Ada juga candaan bahwa sebentar lagi mereka akan melatih pelican yang bersepeda. Katanya sih “benchmark global”
Untuk orang-orang yang mengira lab Tiongkok akan berhenti open source, saya ingin bilang
Itu sepertinya tidak akan terjadi
Coba saja daftar ke coding plan Z.ai — hampir mustahil
Mereka kurang kuat dalam pemasaran, jadi selain merilis model terbuka, mereka nyaris tidak punya cara lain untuk mempertahankan eksistensi
Penjualan mereka juga bergantung pada kanal distribusi seperti OpenRouter atau OpenCode
Pada akhirnya, open source bukan strategi negara melainkan satu-satunya cara komersialisasi
- Ada juga candaan, “kalau begitu kenapa modelnya tidak memasarkan dirinya sendiri?”
  Kalau bahkan promosi diri pun tidak bisa, mungkin itu tanda batas kemampuan performanya
Berbeda dari kebanyakan model Qwen, model kali ini bobotnya tidak dibuka, dan jumlah parameternya juga tidak diumumkan
Selain itu, Opus 4.6 sudah keluar dua bulan lalu, jadi aneh kenapa yang dipakai pembanding justru 4.5
- Di paragraf terakhir blog, mereka mengatakan akan segera merilis varian model kecil sebagai open source
  Sumber
- Jika Opus 4.6 dirilis dua bulan lalu, mungkin saja Qwen belum selesai melakukan pengujian perbandingan
- Sebenarnya model -MAX dan -Omni dari Qwen sejak awal memang tidak dibuka
Menurut saya, membandingkannya dengan Opus 4.5 bukan masalah besar
Justru lebih berguna membandingkannya dengan model yang sudah saya kenal
Jika saya menginginkan performa terbaik, saya akan memakai model lain, tetapi kalau mencari opsi murah dengan kualitas yang mirip, ini tetap cukup berarti
- Jika bisa mendapatkan performa setingkat Opus 4.5 secara gratis, itu layak diperhatikan
  Walau tidak dipakai untuk fitur inti aplikasi, tetap cukup berguna untuk bagian yang kurang penting
- Sejujurnya, Opus 4.6 maupun GPT 5.4 hampir tidak memberi perbedaan yang terasa dibanding generasi sebelumnya
  Jika performa setingkat 4.5 bisa dipakai dengan 1/10 harga, saya akan memilih itu
Hasil benchmark agen memang menarik, tetapi saya penasaran seberapa baik kemampuan pemulihan dari kesalahan Qwen3.6-Plus
Sebagian besar pengujian hanya menangani ‘happy path’,
padahal yang benar-benar penting adalah apakah ia bisa salah di langkah 3 lalu pulih kembali di langkah 15
Saya penasaran apakah ada yang sudah melakukan stress test seperti ini dalam workflow pengembangan nyata
Saya berharap vendor AI berhenti memakai pemasaran yang membandingkan dengan model generasi lama milik pesaing
Tidak ada yang tertipu, dan itu cuma mengikis kepercayaan pada merek
Model Qwen sendiri sangat bagus, jadi sayang reputasinya rusak karena strategi perbandingan seperti ini
Sebenarnya sejak dulu Qwen memang menjalankan versi Plus dan Max sebagai model tertutup
Jadi cara rilis kali ini bukan hal baru
Qwen 3.6 Plus tampaknya hanyalah versi yang lebih dipoles dari 3.5 Plus
Tautan perbandingan

Qwen3.6-Plus: Menuju agen dunia nyata

Ringkasan fitur utama dan performa Qwen3.6-Plus

Evaluasi performa

Performa multimodal

API dan integrasi pengembangan

Coding dan integrasi agen

Integrasi OpenClaw

Integrasi Qwen Code

Integrasi Claude Code

Agen visual dan ekspansi multimodal

Rencana ke depan

Bacaan terkait

1 komentar

Komentar Hacker News