- Model OCR generasi berikutnya yang meningkatkan akurasi dan efisiensi pemrosesan dokumen secara bersamaan, dengan performa pengenalan tinggi pada berbagai jenis dokumen
- Mencatat peningkatan performa keseluruhan sebesar 74% dibanding versi sebelumnya, dengan hasil unggul pada tulisan tangan, formulir, tabel kompleks, dan dokumen hasil pemindaian
- Mendukung rekonstruksi tabel berbasis HTML dan output markdown sehingga informasi struktural dokumen juga dapat dipertahankan
- $2 per 1.000 halaman, dengan diskon 50% untuk pemrosesan massal, menghadirkan efisiensi biaya
- Teknologi OCR yang dapat dimanfaatkan secara luas, mulai dari pipeline dokumen enterprise berskala besar hingga workflow dokumen interaktif, dan muncul sebagai infrastruktur inti untuk pemanfaatan data berbasis AI generatif
Kinerja dan fitur utama
- Mistral OCR 3 melakukan ekstraksi teks dan gambar tertanam dari berbagai dokumen dengan presisi tinggi
- Mendukung output format markdown dan fitur rekonstruksi tabel HTML, sehingga dapat mengenali bukan hanya isi dokumen tetapi juga strukturnya
- Ukuran model yang kecil memungkinkan layanan ini ditawarkan dengan biaya lebih rendah dibanding solusi pesaing, yaitu $2 per 1.000 halaman, atau $1 saat menggunakan Batch API
- Model mistral-ocr-2512 dapat diintegrasikan melalui API, atau PDF dan gambar dapat dikonversi menjadi teks atau JSON terstruktur melalui UI Document AI Playground
Peningkatan performa dan benchmark
- Dalam benchmark internal, model ini mencatat tingkat kemenangan 74% dibanding Mistral OCR 2
- Pengujian dilakukan berdasarkan kasus bisnis nyata dari pelanggan, dan akurasi dievaluasi menggunakan fuzzy-match metric
- Mencapai akurasi yang melampaui solusi pemrosesan dokumen enterprise dan OCR berbasis AI
Area peningkatan utama
- Pengenalan tulisan tangan: menafsirkan tulisan tangan, anotasi campuran, dan tulisan tangan di atas formulir cetak dengan akurat
- Pemrosesan formulir: peningkatan pengenalan kotak, label, input tulisan tangan, dan layout kompleks
- Dokumen pindai dan kompleks: memiliki ketahanan tinggi terhadap artefak kompresi, distorsi, resolusi rendah, dan noise latar belakang
- Struktur tabel kompleks: mereproduksi tabel secara lengkap menggunakan tag HTML (
colspan/rowspan), termasuk header, sel gabungan, serta hierarki multi-baris dan multi-kolom
- Peningkatan performa menyeluruh dibanding Mistral OCR 2 di semua bahasa dan bentuk dokumen
Contoh penggunaan dan bidang aplikasi
- Cocok untuk pipeline dokumen enterprise berskala besar maupun workflow dokumen interaktif
- Mendukung konversi ke markdown setelah ekstraksi teks dan gambar, parsing otomatis formulir dan invoice, pembangunan pipeline pemahaman dokumen, serta digitalisasi tulisan tangan dan dokumen sejarah
- Pelanggan awal menggunakannya untuk mengubah invoice menjadi field terstruktur, mendigitalisasi arsip perusahaan, mengekstrak teks dari laporan teknis dan ilmiah, serta meningkatkan pencarian enterprise
- Tim Law dari IDC menyatakan, “OCR adalah teknologi fondasi bagi AI generatif dan AI agen, dan kemampuan ekstraksi teks yang sangat akurat dengan biaya rendah menentukan daya saing dalam pemanfaatan data”
Pendekatan akses dan kompatibilitas
- Dapat langsung digunakan melalui API atau antarmuka Document AI Playground
- Sepenuhnya kompatibel dengan Mistral OCR 2, sehingga mudah di-upgrade dari sistem yang sudah ada
- Dokumentasi rinci tersedia di mistral.ai/docs
Belum ada komentar.