Gemini 2.5 Deep Think Kini Tersedia di Aplikasi Gemini
(blog.google)- Gemini 2.5 Deep Think kini tersedia untuk pelanggan Google AI Ultra saja di aplikasi Gemini
- Diperkenalkan dengan teknik berpikir paralel (parallel thinking) dan temuan penelitian terbaru, disempurnakan agar lebih cocok untuk penggunaan nyata berdasarkan model yang meraih medali emas di IMO
- Menunjukkan kinerja unggul dalam berbagai tugas kompleks seperti pemecahan masalah kreatif, penalaran matematika dan ilmiah, dan pengembangan algoritme
- Untuk meningkatkan performa, waktu penalaran (Thinking Time) ditingkatkan agar dapat mengeksplorasi beragam ide dan solusi secara bersamaan, lalu menghasilkan pemikiran yang lebih dalam dan output yang lebih kreatif
- Untuk pengembangan AI yang aman dan bertanggung jawab, dilakukan evaluasi dan tindakan yang diperkuat, serta diberikan rencana perluasan pemanfaatan API dan enterprise di masa depan
Peluncuran Gemini 2.5 Deep Think
- Fitur Gemini 2.5 Deep Think disediakan untuk pelanggan Google AI Ultra melalui aplikasi Gemini
- Versi ini menggabungkan umpan balik dari penguji dan peneliti tepercaya serta hasil riset terbaru
- Berbasis pada model tingkat medali emas dari Olimpiade Matematika Internasional (IMO) terbaru, kecepatannya dan utilitas praktisnya ditingkatkan agar sesuai dengan pengalaman pengguna nyata
- Dengan pengumuman ini, potensi sebagai alat pemecahan masalah kreatif diperluas, dan direncanakan penyempurnaan fitur berdasarkan umpan balik dari matematikawan dan peneliti
Cara kerja Deep Think
- Menerapkan teknik berpikir paralel, Gemini mengeksplorasi, membandingkan, dan menggabungkan secara bersamaan berbagai ide dan solusi terhadap masalah kompleks
- Waktu penalaran (Thinking Time) pada model ditingkatkan, sehingga memungkinkan penelusuran lebih mendalam terhadap banyak hipotesis untuk menemukan solusi yang lebih kreatif
- Melalui pembelajaran penguatan, model dilatih untuk memanfaatkan secara aktif jalur penalaran yang diperluas ini, memperkuat kemampuan pemecahan masalah yang lebih intuitif dan mendalam
Performa dan area penggunaan utama Deep Think
- Pengembangan dan desain bertahap: Menunjukkan kinerja tinggi dalam tugas mengembangkan sistem atau desain kompleks secara bertahap
- Penemuan ilmiah dan matematis: Memiliki keunggulan pada eksplorasi kreatif yang menuntut tingkat tinggi, seperti penalaran matematika dan interpretasi makalah ilmiah
- Pengembangan algoritme dan kode: Mencapai performa mutakhir pada masalah pengkodean yang sulit yang membutuhkan pemodelan masalah, kompleksitas waktu, dan pertimbangan trade-off
- Di benchmark terbaru (misalnya LiveCodeBench V6, Humanity's Last Exam), berhasil membuktikan kinerja puncak dalam bidang kode/pengetahuan/penalaran dibandingkan model sebelumnya
Pengembangan bertanggung jawab dan keamanan Gemini
- Gemini 2.5 Deep Think menunjukkan keamanan konten dan tonalitas objektif yang lebih baik dari model Pro sebelumnya dalam evaluasi keselamatan
- Seiring meningkatnya kompleksitas, risiko juga dievaluasi, dan penilaian Frontier Safety serta tindakan mitigasi yang diperlukan diperkuat
- Hasil detail keselamatan dapat dilihat di model card
Cara menggunakan Deep Think
- Pelanggan Google AI Ultra dapat menggunakannya dengan jumlah terbatas per hari di aplikasi Gemini dengan memilih 2.5 Pro dari dropdown model, lalu mengaktifkan toggle Deep Think di bilah prompt
- Terintegrasi secara otomatis dengan alat seperti eksekusi kode, Google Search, dan lain-lain, sehingga memungkinkan pembuatan jawaban yang jauh lebih panjang
- Pengujian tambahan untuk API dan enterprise Gemini akan segera dilaksanakan
1 komentar
Komentar Hacker News
Saya mencoba agent Deep Think yang baru, tetapi baru memasukkan lima prompt saja sudah mencapai batas penggunaan harian. Kalau layanannya seperti ini dengan membayar $250 per bulan, rasanya cukup mengecewakan. Daya saing harganya jelas kalah dibanding o3-pro atau Grok 4 Heavy. Di komunitas AI, fitur ini sempat menarik perhatian sebagai satu-satunya bagian yang setidaknya bisa membenarkan harga langganan Google Ultra. Namun Google justru memberikan model terbaiknya secara gratis di AI Studio, sementara pelanggan Ultra yang benar-benar membayar dikenai kebijakan seperti ini, jadi sulit dipahami. Dari sisi performa, saat saya memasukkan situasi masalah bisnis yang kompleks, ia memberikan solusi yang jelas dan meyakinkan, dan jawabannya sejalan dengan hasil rapat internal kami. Tapi pada akhirnya, o3 juga memberikan kesimpulan serupa dengan harga jauh lebih murah. Hanya saja, laporan dari o3 terasa sedikit kurang rapi. Mungkin perlu dipakai lebih lama untuk benar-benar tahu
Teman-teman, ini hasil ketika saya memberi prompt ke Gemini Deep Think: “tolong gambar gambar SVG pelikan yang sedang naik sepeda” https://www.svgviewer.dev/s/5R5iTexQ Saya melakukannya lebih dulu daripada Simon Willison!
Kalau ingin menjalankannya sendiri, Anda bisa memakai LLM cli milik simonw dan plugin llm-consortiumKeunggulan 1: bisa bebas menggabungkan berbagai model. Bisa diatur dengan kombinasi apa pun tanpa peduli laboratoriumnyaKeunggulan 2: dengan plugin llm-model-gateway, bisa langsung dihubungkan sekaligus ke app atau alat kolaborasi coding saya lewat API lokal https://x.com/karpathy/status/1870692546969735361
Dia juga menuliskan sendiri instalasi dan contoh perintah, bahkan contoh bahwa consortium of consortium juga bisa dibuat.
https://GitHub.com/irthomasthomas/llm-consortium
llm servetidak terlihatIni bukan model yang meraih medali emas di IMO beberapa minggu lalu, tetapi kerabat dekat yang hampir setara https://x.com/OfficialLoganK/status/1951262261512659430 Saat ini belum tersedia lewat API
Pendekatan kali ini mirip dengan Grok 4 Heavy: menjalankan beberapa agent ‘penalaran’ secara paralel, lalu membandingkan jawaban mereka dan memilih yang terbaik, dengan waktu sekitar 30 menit. Hasilnya memang luar biasa, tetapi sebenarnya perbandingan benchmark yang adil seharusnya memakai Grok 4 Heavy, bukan Grok 4 yang single-agent dan lebih cepat
OpenAI menaikkan harga ke $200, Anthropic ke $100 dan $200, Gemini ke $250, dan Grok sampai $300. Hanya OpenAI yang menyebut “praktis tanpa batas”, dan saya memang belum pernah mencapai batas di paket ChatGPT Pro. Sebaliknya, untuk Claude Max saya sudah beberapa kali terkena batas. Jadi saya penasaran kenapa perusahaan-perusahaan seperti ini tidak mengungkapkan batasnya dengan jelas
Dalam beberapa bulan terakhir saya memakai Gemini, dan rasanya justru makin memburuk. Hallucination terlalu sering muncul, dan bahkan ketika itu ditunjukkan, AI-nya tetap keras kepala. Jadi makin sulit dipercaya
Untuk pelanggan Google AI Ultra, diberi tahu bahwa mulai hari ini mereka bisa memakai fitur Deep Think di aplikasi Gemini dengan jumlah prompt yang sudah ditetapkan. Tetapi saya ingin tahu lebih spesifik apakah “set tetap” itu berarti jumlahnya tetap, atau jenis prompt-nya yang ditentukan
Saat menyusun jadwal dengan Gemini CLI, meskipun saya sudah memberi instruksi dengan jelas berkali-kali agar jangan bertindak seenaknya dan saya sudah ikut campur, ia tetap sering mencoba mengubah hal-hal secara arbitrer dan akhirnya merusak rencana