- Mistral AI menambahkan 5 fitur baru ke Le Chat untuk membuat eksplorasi, ekspresi, dan pengorganisasian pengguna menjadi lebih alami dan lebih kuat
- Mode Deep Research menyediakan kemampuan untuk dengan cepat merangkum pertanyaan kompleks menjadi laporan riset yang terstruktur
- Mode suara memungkinkan percakapan yang alami dan cepat melalui model suara baru Voxtral, serta dapat digunakan tanpa mengetik
- Fitur penalaran multibahasa berbasis Magistral menghasilkan respons yang jelas dan mendalam dalam berbagai bahasa, serta mendukung pergantian bahasa di dalam kalimat
- Fitur Projects mengatur dan mengingat percakapan, dokumen, dan ide per proyek sehingga cocok untuk pekerjaan jangka panjang
What’s new in Le Chat.
1. Mode Deep Research
- Fitur yang dengan cepat meneliti topik kompleks dalam format laporan terstruktur
- Memecah pertanyaan pengguna, mencari sumber tepercaya, lalu menyusunnya menjadi laporan yang rapi
- Menggunakan agen Deep Research berbasis alat, tetapi pengalaman pengguna tetap sederhana, transparan, dan terasa kolaboratif
2. Mode suara
- Memungkinkan percakapan suara yang alami dengan menggunakan model suara baru bernama Voxtral
- Cocok untuk berbagai situasi seperti brainstorming ide saat berjalan, menjawab pertanyaan cepat saat bepergian, dan mendikte isi rapat
- Dengan latensi rendah, mampu mengikuti kecepatan bicara pengguna
3. Penalaran multibahasa native
- Berdasarkan model penalaran Magistral, mampu menjawab pertanyaan kompleks dengan jelas dalam berbagai bahasa
- Menguntungkan untuk penggunaan multibahasa seperti menyusun draf proposal dalam bahasa Spanyol atau menjelaskan konsep hukum dalam bahasa Jepang
- Juga mendukung pergantian bahasa di dalam kalimat (code-switching)
4. Projects
- Mengatur percakapan terkait dalam bentuk folder berbasis konteks
- Setiap proyek mengingat pustaka dan status konfigurasi alatnya masing-masing
- Mendukung lingkungan kerja yang konsisten bersama unggahan dokumen, pemanggilan isi pustaka, percakapan, dan ide
- Berguna untuk perencanaan pindahan, perancangan fitur produk, dan pengelolaan proyek jangka panjang
5. Pengeditan gambar lanjutan
- Berbeda dari alat pembuat gambar dari teks pada umumnya, gambar yang sudah dihasilkan juga bisa diedit langsung
- Contoh: adegan dapat diubah dengan prompt seperti “hapus objek” atau “pindahkan ke kota lain”
- Dapat diedit sebagai seri sambil menjaga konsistensi pada tokoh, objek, dan elemen desain
1 komentar
Opini Hacker News
Fitur pengeditan gambarnya tampak sangat unggul; malah rasanya itu justru poin utamanya, tetapi tidak terlalu ditonjolkan. Model OpenAI cenderung mengubah gambar secara keseluruhan dan merusak detail di bagian yang tidak terkait dengan kueri, sedangkan model ini sangat mengesankan karena dapat mempertahankan dengan sempurna bagian yang tidak terkait dengan kueri sambil menerapkan edit yang diinginkan dengan sangat baik. Namun, resolusi keluarannya agak mengecewakan (gambar masukannya jauh lebih besar, tetapi hasilnya 1184px). Saya mengunggah foto kantor rumah dan meminta, "pulihkan panel abu-abu yang sedikit robek di bagian bawah agar terlihat sepenuhnya baru," dan hasilnya sangat bagus. Kualitas output sedikit sekali di bawah aslinya, tetapi saya berharap bagian ini juga akan segera membaik
Gambar input: https://i.imgur.com/t0WCKAu.jpeg
Gambar hasil: https://i.imgur.com/xb99lmC.png
Teknologi seperti ini sepertinya akan memberi pukulan besar ke Craigslist. Misalnya, kita datang karena mengira mobilnya baik-baik saja dari foto, tetapi ternyata saat sampai fender-nya penyok, kap mesin berlubang, dan lampunya pecah.
Pernah ada kasus agen properti yang memakai AI untuk menata ulang foto rumah sepenuhnya (membuat rumah tua terlihat seperti rumah baru). Orang-orang datang langsung dan sangat marah. Si agen mengklaim ini hanya satu tingkat dari sekadar staging, tetapi dalam kasus ini jelas tidak berhasil. Akhirnya listing-nya ditarik, dan banyak orang juga datang untuk membantu memperbaiki rumah itu (kemungkinan besar keluarga, meski tidak pasti)
Sekadar catatan, tautan gambar input dan hasil yang kamu unggah sama. Awalnya saya bingung saat mencoba mencari perbedaannya
Untuk tugas tertentu, Kontext mungkin lebih baik, dan sepertinya Mistral memakai itu. Yang jelas, cepat dan murah.
Namun, OpenAI juga kemarin menambahkan fitur pengeditan gambar resolusi lebih tinggi. Saya belum tahu apakah ini hanya berlaku di API atau juga akan diterapkan di UI chat. Hasil dengan prompt dan gambar input yang sama: https://i.imgur.com/w5Q0UQm.png
Kabar terbaru dari OpenAI: https://x.com/OpenAIDevs/status/1945538534884135132
Mereka memakai Flux Kontext dari Black Forest Labs, dan itu memang model yang sangat bagus
Judul-judul buku pada hasil gambar jadi berantakan
Akhirnya terasa seperti EU sudah bangun. Saya bangga akan hal ini. Begitu kontrak dengan OpenAI berakhir, saya berencana langsung pindah ke Mistral. Kita harus mendukung Eropa, Viva La France
Di bagian "One more thing" pada posting blog Mistral Medium 3 bulan Mei, ada isi seperti ini:
Saya sedang mengalami MRF, yaitu Model Release Fatigue. Model-model besar keluar terlalu sering, jadi saya terus mengganti model di IDE, lalu saat menyalakan lagi hal yang sebelumnya berjalan baik, sekarang jadi terasa kurang bagus.
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral… kalau terus gonta-ganti rasanya kepala jadi pusing terus
Ini kelelahan akibat terus berpindah model LLM
Saya paham perasaanmu, tetapi menurut saya justru bagus sekali kalau pilihan yang beragam seperti ini terus bermunculan. Laju inovasinya juga luar biasa. Kalau ingin selalu memakai model terbaik, perjalanannya memang melelahkan, tetapi tetap jauh lebih baik daripada stagnasi atau monopoli
Karena itu saya hampir tidak mencoba teknologi baru seperti ini (meski memang menarik). Saya berpikir untuk mulai memakainya sendiri sekitar paruh kedua 2026. Saat itu model lokal dan hardwarenya mungkin sudah lebih berkembang.
Salut untuk mereka yang sekarang sanggup menghadapi semua versi eksperimental ini
Persaingan seperti ini justru sangat bagus. Saya selalu memakai model premium, tetapi hampir tidak mengeluarkan uang. Selalu ada promosi atau kesempatan yang nyaris gratis
Tidak harus selalu mengikuti semuanya. Cukup pakai satu model yang cocok untuk diri sendiri secara konsisten
Penurunan performa versi lama terjadi karena penyedia layanan memusatkan sumber daya pada versi baru. Ada juga pengaruh cutoff data pelatihan versi lama (misalnya: claude sonnet 3.5→3.7).
Secara pribadi saya hanya memakai Claude/Anthropic. Menurut saya model itu lebih memahami saya. Sudah cukup pintar sehingga saya jarang merasa perlu memakai versi terbaru
Alasan perilisan Voxtral menarik adalah karena transcription audio open-source yang kompetitif (transcription, suara→teks) kembali menjadi aktif. Saya memang ragu apakah backbone LLM benar-benar diperlukan, tetapi pendekatannya tetap menarik
Siaran pers Mistral membuatnya terkesan seperti yang terbaik sejak Whisper, tetapi pembanding nyatanya bukan yang papan atas.
Benchmark terbuka: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
Sebagai referensi, Scribe yang dibandingkan Mistral berada di peringkat 10.
Memang ini benchmark bahasa Inggris, tetapi banyak juga model multibahasa sehingga tetap berguna sebagai acuan (mis. https://huggingface.co/nvidia/canary-1b-flash)
Sekarang saya jauh lebih tertarik pada model dengan data yang terbuka (dan bisa diverifikasi secara etis), dibanding open-code atau open-weight.
Misalnya, saya ingin memakai model yang bisa memberi tahu apakah sumber daya yang saya tentukan masuk ke data pelatihannya atau tidak
Belakangan ini sulit menghilangkan kesan bahwa industri AI hanya menyalin layanan OpenAI.
Layanan perusahaan lain juga, meski strukturnya sedikit berbeda, pada dasarnya tetap layanan yang sama.
Inovasinya sendiri juga sebenarnya tidak setinggi itu
Kalau benar-benar dipakai, sama sekali tidak terasa sama. Untuk pekerjaan sehari-hari seperti coding, perbedaan antar model sangat besar
Rasanya sekarang seluruh dunia sedang membangun layanan baru di atas fungsi
f(input: string): string. Jadi wajar kalau semuanya jadi miripOpenAI juga mengambil fitur Deep Research dari Google. Namanya sama, dan Mistral juga begitu
Justru inilah persaingan pasar yang sehat. Contoh seperti Apple yang terus berinovasi selama puluhan tahun adalah hasil dari gatekeeping yang monopolistis
Pada akhirnya, teknologi yang diterapkan memang hampir sama di mana-mana. Bedanya hanya pada data pelatihan dan daya komputasi
Saya sangat sering memakai ChatGPT. Saya ingin mencoba Le Chat juga, tetapi penasaran apakah akan ada perbedaan besar, atau sebenarnya hampir mirip
Kalau belum pernah mencoba fitur Deep Research dari OpenAI, saya sangat merekomendasikannya. Saya belum menemukan layanan alternatif yang benar-benar sebanding. Saya juga sudah mencoba milik Google, tetapi tidak terlalu mengesankan.
Para engineer bisa menghemat waktu sangat besar saat meneliti trade-off
Fitur Research dari Anthropic juga cukup bagus. Menurut saya setara dengan OpenAI.
Google versi berbayarnya sedikit lebih akurat, tetapi laporan hasilnya terlalu bertele-tele sehingga tidak nyaman dibaca. Rasanya seperti laporan mahasiswa yang memanjangkan isi demi memenuhi jumlah kata
Bagi saya, ini sangat membantu terutama untuk riset pasar (terkait startup). Rasanya seperti mempekerjakan asisten perencana/PM junior yang cerdas
Saya juga merekomendasikan mencoba fitur riset di Kimi 2. Saya terkejut karena hasilnya jauh lebih bagus daripada yang saya duga
Hasil dari OpenAI dan Gemini cukup berbeda. Tidak bisa dibilang yang satu lebih baik; memang hanya sangat berbeda
Perplexities juga lumayan. Hanya saja, saya tidak punya langganan berbayar OpenAI jadi tidak bisa membandingkannya langsung
Contoh prompt-nya kurang bagus. Misalnya, untuk jawaban terkait rencana pribadi, justru jauh lebih baik menjawab langsung tanpa Deep Research (hanya bagian visa yang dijawab dengan benar)
Apakah Voxtral mungkin bisa diterapkan ke keyboard Futo Android?