Mistral AI menambahkan Deep Research, Voice, Project, dan lainnya ke Le Chat

(mistral.ai)

3 poin oleh GN⁺ 2025-07-18 | 1 komentar | Bagikan ke WhatsApp

Mistral AI menambahkan 5 fitur baru ke Le Chat untuk membuat eksplorasi, ekspresi, dan pengorganisasian pengguna menjadi lebih alami dan lebih kuat
Mode Deep Research menyediakan kemampuan untuk dengan cepat merangkum pertanyaan kompleks menjadi laporan riset yang terstruktur
Mode suara memungkinkan percakapan yang alami dan cepat melalui model suara baru Voxtral, serta dapat digunakan tanpa mengetik
Fitur penalaran multibahasa berbasis Magistral menghasilkan respons yang jelas dan mendalam dalam berbagai bahasa, serta mendukung pergantian bahasa di dalam kalimat
Fitur Projects mengatur dan mengingat percakapan, dokumen, dan ide per proyek sehingga cocok untuk pekerjaan jangka panjang

What’s new in Le Chat.

1. Mode Deep Research

Fitur yang dengan cepat meneliti topik kompleks dalam format laporan terstruktur
Memecah pertanyaan pengguna, mencari sumber tepercaya, lalu menyusunnya menjadi laporan yang rapi
Menggunakan agen Deep Research berbasis alat, tetapi pengalaman pengguna tetap sederhana, transparan, dan terasa kolaboratif

2. Mode suara

Memungkinkan percakapan suara yang alami dengan menggunakan model suara baru bernama Voxtral
Cocok untuk berbagai situasi seperti brainstorming ide saat berjalan, menjawab pertanyaan cepat saat bepergian, dan mendikte isi rapat
Dengan latensi rendah, mampu mengikuti kecepatan bicara pengguna

3. Penalaran multibahasa native

Berdasarkan model penalaran Magistral, mampu menjawab pertanyaan kompleks dengan jelas dalam berbagai bahasa
Menguntungkan untuk penggunaan multibahasa seperti menyusun draf proposal dalam bahasa Spanyol atau menjelaskan konsep hukum dalam bahasa Jepang
Juga mendukung pergantian bahasa di dalam kalimat (code-switching)

4. Projects

Mengatur percakapan terkait dalam bentuk folder berbasis konteks
Setiap proyek mengingat pustaka dan status konfigurasi alatnya masing-masing
Mendukung lingkungan kerja yang konsisten bersama unggahan dokumen, pemanggilan isi pustaka, percakapan, dan ide
Berguna untuk perencanaan pindahan, perancangan fitur produk, dan pengelolaan proyek jangka panjang

5. Pengeditan gambar lanjutan

Berbeda dari alat pembuat gambar dari teks pada umumnya, gambar yang sudah dihasilkan juga bisa diedit langsung
Contoh: adegan dapat diubah dengan prompt seperti “hapus objek” atau “pindahkan ke kota lain”
Dapat diedit sebagai seri sambil menjaga konsistensi pada tokoh, objek, dan elemen desain

1 komentar

GN⁺ 2025-07-18

Opini Hacker News

Fitur pengeditan gambarnya tampak sangat unggul; malah rasanya itu justru poin utamanya, tetapi tidak terlalu ditonjolkan. Model OpenAI cenderung mengubah gambar secara keseluruhan dan merusak detail di bagian yang tidak terkait dengan kueri, sedangkan model ini sangat mengesankan karena dapat mempertahankan dengan sempurna bagian yang tidak terkait dengan kueri sambil menerapkan edit yang diinginkan dengan sangat baik. Namun, resolusi keluarannya agak mengecewakan (gambar masukannya jauh lebih besar, tetapi hasilnya 1184px). Saya mengunggah foto kantor rumah dan meminta, "pulihkan panel abu-abu yang sedikit robek di bagian bawah agar terlihat sepenuhnya baru," dan hasilnya sangat bagus. Kualitas output sedikit sekali di bawah aslinya, tetapi saya berharap bagian ini juga akan segera membaik
- Gambar input: https://i.imgur.com/t0WCKAu.jpeg
- Gambar hasil: https://i.imgur.com/xb99lmC.png
- Teknologi seperti ini sepertinya akan memberi pukulan besar ke Craigslist. Misalnya, kita datang karena mengira mobilnya baik-baik saja dari foto, tetapi ternyata saat sampai fender-nya penyok, kap mesin berlubang, dan lampunya pecah.
  Pernah ada kasus agen properti yang memakai AI untuk menata ulang foto rumah sepenuhnya (membuat rumah tua terlihat seperti rumah baru). Orang-orang datang langsung dan sangat marah. Si agen mengklaim ini hanya satu tingkat dari sekadar staging, tetapi dalam kasus ini jelas tidak berhasil. Akhirnya listing-nya ditarik, dan banyak orang juga datang untuk membantu memperbaiki rumah itu (kemungkinan besar keluarga, meski tidak pasti)
- Sekadar catatan, tautan gambar input dan hasil yang kamu unggah sama. Awalnya saya bingung saat mencoba mencari perbedaannya
- Untuk tugas tertentu, Kontext mungkin lebih baik, dan sepertinya Mistral memakai itu. Yang jelas, cepat dan murah.
  Namun, OpenAI juga kemarin menambahkan fitur pengeditan gambar resolusi lebih tinggi. Saya belum tahu apakah ini hanya berlaku di API atau juga akan diterapkan di UI chat. Hasil dengan prompt dan gambar input yang sama: https://i.imgur.com/w5Q0UQm.png
- Kabar terbaru dari OpenAI: https://x.com/OpenAIDevs/status/1945538534884135132
- Mereka memakai Flux Kontext dari Black Forest Labs, dan itu memang model yang sangat bagus
- Judul-judul buku pada hasil gambar jadi berantakan
Akhirnya terasa seperti EU sudah bangun. Saya bangga akan hal ini. Begitu kontrak dengan OpenAI berakhir, saya berencana langsung pindah ke Mistral. Kita harus mendukung Eropa, Viva La France
- Sebenarnya saya hanya menunggu Mistral Large 3. Sudah ada petunjuk sebelumnya, dan sepertinya itu akan segera diterapkan sebagai model bahasa dasar untuk Le Chat yang baru.
  Di bagian "One more thing" pada posting blog Mistral Medium 3 bulan Mei, ada isi seperti ini:
Maret ada Mistral Small, hari ini Medium, dan kami sedang bersiap merilis 'large' dalam waktu dekat. Karena model Medium sudah jauh mengungguli model open-source unggulan lain (seperti Llama 4 Maverick), langkah berikutnya sangat layak dinantikan
Kalau versinya seperti ini, rasanya selisih dengan model besar terbaik pun tidak akan lagi terlalu berarti. Kecepatan tinggi dari Cerebras juga memberi pengalaman pengguna yang benar-benar luar biasa dibanding ChatGPT
Saya sedang mengalami MRF, yaitu Model Release Fatigue. Model-model besar keluar terlalu sering, jadi saya terus mengganti model di IDE, lalu saat menyalakan lagi hal yang sebelumnya berjalan baik, sekarang jadi terasa kurang bagus.
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral… kalau terus gonta-ganti rasanya kepala jadi pusing terus
Ini kelelahan akibat terus berpindah model LLM
- Saya paham perasaanmu, tetapi menurut saya justru bagus sekali kalau pilihan yang beragam seperti ini terus bermunculan. Laju inovasinya juga luar biasa. Kalau ingin selalu memakai model terbaik, perjalanannya memang melelahkan, tetapi tetap jauh lebih baik daripada stagnasi atau monopoli
- Karena itu saya hampir tidak mencoba teknologi baru seperti ini (meski memang menarik). Saya berpikir untuk mulai memakainya sendiri sekitar paruh kedua 2026. Saat itu model lokal dan hardwarenya mungkin sudah lebih berkembang.
  Salut untuk mereka yang sekarang sanggup menghadapi semua versi eksperimental ini
- Persaingan seperti ini justru sangat bagus. Saya selalu memakai model premium, tetapi hampir tidak mengeluarkan uang. Selalu ada promosi atau kesempatan yang nyaris gratis
- Tidak harus selalu mengikuti semuanya. Cukup pakai satu model yang cocok untuk diri sendiri secara konsisten
- Penurunan performa versi lama terjadi karena penyedia layanan memusatkan sumber daya pada versi baru. Ada juga pengaruh cutoff data pelatihan versi lama (misalnya: claude sonnet 3.5→3.7).
  Secara pribadi saya hanya memakai Claude/Anthropic. Menurut saya model itu lebih memahami saya. Sudah cukup pintar sehingga saya jarang merasa perlu memakai versi terbaru
Alasan perilisan Voxtral menarik adalah karena transcription audio open-source yang kompetitif (transcription, suara→teks) kembali menjadi aktif. Saya memang ragu apakah backbone LLM benar-benar diperlukan, tetapi pendekatannya tetap menarik
- Sebenarnya ada jauh lebih banyak model STT open-source yang kuat.
  Siaran pers Mistral membuatnya terkesan seperti yang terbaik sejak Whisper, tetapi pembanding nyatanya bukan yang papan atas.
  Benchmark terbuka: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
  Sebagai referensi, Scribe yang dibandingkan Mistral berada di peringkat 10.
  Memang ini benchmark bahasa Inggris, tetapi banyak juga model multibahasa sehingga tetap berguna sebagai acuan (mis. https://huggingface.co/nvidia/canary-1b-flash)
Sekarang saya jauh lebih tertarik pada model dengan data yang terbuka (dan bisa diverifikasi secara etis), dibanding open-code atau open-weight.
Misalnya, saya ingin memakai model yang bisa memberi tahu apakah sumber daya yang saya tentukan masuk ke data pelatihannya atau tidak
Belakangan ini sulit menghilangkan kesan bahwa industri AI hanya menyalin layanan OpenAI.
Layanan perusahaan lain juga, meski strukturnya sedikit berbeda, pada dasarnya tetap layanan yang sama.
Inovasinya sendiri juga sebenarnya tidak setinggi itu
- Kalau benar-benar dipakai, sama sekali tidak terasa sama. Untuk pekerjaan sehari-hari seperti coding, perbedaan antar model sangat besar
- Rasanya sekarang seluruh dunia sedang membangun layanan baru di atas fungsi f(input: string): string. Jadi wajar kalau semuanya jadi mirip
- OpenAI juga mengambil fitur Deep Research dari Google. Namanya sama, dan Mistral juga begitu
- Justru inilah persaingan pasar yang sehat. Contoh seperti Apple yang terus berinovasi selama puluhan tahun adalah hasil dari gatekeeping yang monopolistis
- Pada akhirnya, teknologi yang diterapkan memang hampir sama di mana-mana. Bedanya hanya pada data pelatihan dan daya komputasi
Saya sangat sering memakai ChatGPT. Saya ingin mencoba Le Chat juga, tetapi penasaran apakah akan ada perbedaan besar, atau sebenarnya hampir mirip
Kalau belum pernah mencoba fitur Deep Research dari OpenAI, saya sangat merekomendasikannya. Saya belum menemukan layanan alternatif yang benar-benar sebanding. Saya juga sudah mencoba milik Google, tetapi tidak terlalu mengesankan.
Para engineer bisa menghemat waktu sangat besar saat meneliti trade-off
- Fitur Research dari Anthropic juga cukup bagus. Menurut saya setara dengan OpenAI.
  Google versi berbayarnya sedikit lebih akurat, tetapi laporan hasilnya terlalu bertele-tele sehingga tidak nyaman dibaca. Rasanya seperti laporan mahasiswa yang memanjangkan isi demi memenuhi jumlah kata
- Bagi saya, ini sangat membantu terutama untuk riset pasar (terkait startup). Rasanya seperti mempekerjakan asisten perencana/PM junior yang cerdas
- Saya juga merekomendasikan mencoba fitur riset di Kimi 2. Saya terkejut karena hasilnya jauh lebih bagus daripada yang saya duga
- Hasil dari OpenAI dan Gemini cukup berbeda. Tidak bisa dibilang yang satu lebih baik; memang hanya sangat berbeda
- Perplexities juga lumayan. Hanya saja, saya tidak punya langganan berbayar OpenAI jadi tidak bisa membandingkannya langsung
Contoh prompt-nya kurang bagus. Misalnya, untuk jawaban terkait rencana pribadi, justru jauh lebih baik menjawab langsung tanpa Deep Research (hanya bagian visa yang dijawab dengan benar)
Apakah Voxtral mungkin bisa diterapkan ke keyboard Futo Android?

Mistral AI menambahkan Deep Research, Voice, Project, dan lainnya ke Le Chat

What’s new in Le Chat.

1. Mode Deep Research

2. Mode suara

3. Penalaran multibahasa native

4. Projects

5. Pengeditan gambar lanjutan

Bacaan terkait

1 komentar

Opini Hacker News