Keynote Qwen Conference pertama yang digelar di Singapura menjadi ajang Alibaba Cloud meresmikan transisi menuju "era AI agentik". Tokoh dari pemerintah Singapura, eksekutif Alibaba Cloud, serta mitra seperti Nous Research, Fireworks AI, NVIDIA, dan PicsArt naik ke panggung untuk mengumumkan perubahan di model, infrastruktur, alat, dan ekosistem secara menyeluruh. Pesan utamanya adalah membangun infrastruktur full-stack yang mengubah "token menjadi kecerdasan, kecerdasan menjadi tindakan, dan tindakan menjadi nilai bisnis".
Poin utama pengumuman
-
Kolaborasi dengan pemerintah Singapura: Menteri Negara Desmond Tan mengumumkan rencana kerja sama dengan Alibaba Cloud, NTUC, dan ST Telemedia Data Centre untuk menyediakan pelatihan praktik AI generatif dan agentik kepada lebih dari 1.000 perusahaan lokal, pengembang, dan pelajar. Ia menekankan prinsip bahwa "AI tidak menggantikan pekerja, melainkan bekerja untuk pekerja".
-
Peluncuran Qwen 3.7 Max: Model foundation baru diperkenalkan dengan peningkatan besar pada kemampuan coding, penggunaan alat (dukungan bawaan untuk protokol MCP), multimodal, dan tugas long-horizon. Disebut mencatat performa papan atas di benchmark utama seperti SWE-Bench, IFBench, dan HLE.
-
Pengumuman Qwen Cloud: Gateway khusus agent di
qwencloud.comtelah diluncurkan. Layanan ini menawarkan lebih dari 200 model, paket harga berbasis token (US$30 per bulan dari paket Standard hingga Max), serta fitur otomatisasi workflow berbasis Skills/CLI. -
Coder dan Muron: Diperkenalkan Coder, alat vibe coding yang dipasang di laptop, serta Muron, agen multi-domain yang berjalan 24 jam di cloud. Muron sudah digunakan di 43 negara, dan Alibaba juga mengungkap bahwa mereka membangun Coder Works secara internal hanya dengan 5 orang dalam 7 hari.
-
Infrastruktur cloud agentik: Alibaba memamerkan sandbox berbasis MicroVM (boot dalam hitungan milidetik, mendukung 10.000 sesi serentak per tenant), serta full-stack yang mencakup agent ID, governance, security, memory, dan data plane. MiniMax disebut berhasil mencapai boot container 20~40ms dan menurunkan TCO sebesar 40% di atas infrastruktur ini.
Diferensiasi teknis
- Integrasi full-stack: Alibaba menonjolkan diri sebagai salah satu dari hanya dua hyperscaler yang memiliki seluruh lapisan secara mandiri, dari silicon (PPU buatan sendiri, CIPU generasi ke-5) hingga model foundation.
- Cloud native untuk agent: Lepas dari struktur SaaS berpusat pada manusia, Alibaba sedang mendesain ulang seluruh control plane menjadi API dan infrastruktur yang dipanggil dan digunakan langsung oleh agent.
- Ekosistem terbuka: Alibaba bergabung sebagai anggota platinum PyTorch Foundation, dan menempatkan bahkan vendor model pesaing seperti Kimi, Zhipu, MiniMax, StepFun, dan Vidu di model studio untuk mengarah menjadi hub multi-model.
Bagian yang ditonjolkan sebagai kelebihan
- Efisiensi biaya: Paket token disebut memberikan visibilitas biaya dan kontrol anggaran, sementara pemilihan model otomatis di Coder diklaim dapat memangkas biaya token hingga 70%.
- Kemampuan eksekusi jangka panjang: Qwen 3.7 Max diklaim menunjukkan contoh seperti berjalan terus selama 35 jam, melakukan lebih dari 1.000 pemanggilan alat, dan peningkatan kecepatan rata-rata 10x.
- Kepercayaan dan keamanan: Alibaba tercatat sebagai satu-satunya vendor Asia Pasifik di Gartner 2025 Access Management Magic Quadrant, serta menekankan keamanan runtime seperti agent firewall dan ID guard.
Keterbatasan dan tantangan yang disorot
- Sulitnya membangun kepercayaan: Tommy Eastman dari Nous Research menyoroti bahwa menjalankan tugas yang sama secara konsisten dan dapat direproduksi masih menjadi pekerjaan besar, dan memerlukan pendekatan tiga tahap: kualitas model, human-in-the-loop, dan governance antar-agent.
- Bottleneck memori: Fireworks AI menilai bottleneck terbesar dalam inferensi bukan komputasi melainkan memori KV cache, dan mendiagnosis perlunya storage multi-tier serta redesain sistem secara menyeluruh.
- CPU kembali jadi sorotan: NVIDIA menunjukkan bahwa karena sifat pemanggilan alat yang serial pada agent, permintaan untuk CPU baru dengan performa single-thread tinggi akan melonjak, sehingga asumsi desain CPU cloud yang ada mulai terguncang.
Contoh ekosistem
- PicsArt: Dengan basis 130 juta pengguna, PicsArt mengintegrasikan model Qwen Image, Wan, dan Happy Horse untuk mendemonstrasikan workflow agentik seperti casting persona dan pembuatan iklan video. Setelah mengadopsi Happy Horse, jumlah pembuatan video disebut meningkat 72%.
- Hackathon global: Alibaba juga mengumumkan Qwen Cloud Global Hackathon dengan total hadiah US$70.000 dan Happy Horse Awards 2026 secara bersamaan untuk menarik pengembang dan kreator.
Perbandingan dengan konferensi Google
Google Cloud Next 2025 (April) dan I/O 2025 (Mei), yang digelar sebulan lebih awal, pada dasarnya juga mengarah ke arah yang sama, tetapi dengan senjata yang berbeda.
- Lini pengumuman Google: Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), protokol Agent2Agent (A2A), TPU Ironwood generasi ke-7, kacamata Android XR, hingga Veo 3, dengan pengumuman yang mencakup pencarian, perangkat, dan infrastruktur.
- Metrik pengguna Google: AI Mode mencapai 150 juta pengguna di 200 negara, aplikasi Gemini mencapai 400 juta pengguna bulanan, dan throughput token meningkat 50x dalam setahun dari 9,7 triliun menjadi 480 triliun.
- Perbedaan strategi: Jika Alibaba menggenggam integrasi vertikal full-stack sekaligus strategi hub berbasis open source (lebih dari 450 model, total unduhan 2 miliar) dan penempatan model pesaing, maka Google melawannya dengan titik kontak pengguna yang sangat besar serta keunggulan TPU sendiri dan standar A2A.
- Kelemahan masing-masing: Google masih mempertahankan Gemini utama sebagai produk tertutup dan banyak pengumumannya masih berstatus "coming soon", sementara Alibaba menghadapi tantangan akses ke pasar AS dan Eropa serta isu reliabilitas dan bottleneck memori yang juga dibahas di panel.
- Area keunggulan jangka pendek: Dalam jangka pendek, Google unggul pada skala pengguna dan form factor, sementara Alibaba pada biaya infrastruktur dan kawasan non-AS
Alibaba Cloud menilai bahwa hanya mengandalkan daya saing model sendiri tidak cukup untuk merebut kepemimpinan di era agent. Karena itu, perusahaan mendorong integrasi vertikal dari silicon, model, infrastruktur, alat, hingga ekosistem sekaligus melakukan ekspansi horizontal dengan merangkul PyTorch dan bahkan vendor model pesaing. Namun, karena tantangan mendasar seperti reliabilitas, bottleneck memori, dan redesain arsitektur CPU berulang kali dibahas dalam panel, pembuktian bahwa cloud agentik benar-benar dapat memberikan performa dan keekonomian yang dijanjikan pada workload enterprise masih menjadi tugas ke depan. Niat menjadikan Singapura sebagai basis bisnis internasional untuk memulai persaingan serius dengan hyperscaler AS juga tampak jelas di seluruh acara ini.
5 komentar
Saya sudah merevisi isinya. Mohon ditinjau sebelum artikel dipublikasikan.
Ini artikel yang cukup memberi pelajaran bahwa sekalipun ditulis otomatis oleh AI, tetap harus diverifikasi oleh manusia.
Bukannya
qwen, bukanquen? Sepertinya AI salah saat membuat transkrip.Jeli banget, saya malah membacanya sebagai qwen wkwkwkwk
Iya, saya juga sempat berpikir sambil membaca, Quen itu apa ya??