Dengan latar belakang persaingan yang semakin sengit dalam model AI, startup Prancis Mistral telah meluncurkan API Optical Character Recognition (OCR) yang disebut Mistral OCR, yang bertujuan untuk memberikan perusahaan pemahaman dokumen yang lebih maju. Alat ini tidak hanya mengekstraksi konten dari PDF yang berantakan dan file gambar, tetapi juga mengatur elemen -elemen kompleks seperti catatan tulisan tangan, teks cetak, gambar, tabel dan formula menjadi data terstruktur, memberikan kenyamanan besar bagi perusahaan untuk memproses data yang tidak terstruktur besar -besaran.
Peluncuran Mistral OCR menandai tahap pengembangan baru dalam teknologi OCR. Ini bukan hanya alat pengenalan teks sederhana, tetapi juga ahli interpretasi dokumen senior yang dapat memahami elemen dan fitur yang memetik berbagai dokumen, termasuk tabel, ekspresi matematika, dan gambar yang diselingi di dalamnya, dan memastikan struktur hasil output. Kemampuan ini sangat penting bagi perusahaan, karena hingga 90% dari informasi perusahaan ada dalam bentuk data yang tidak terstruktur, seperti email, posting media sosial, video dan gambar, yang selalu membuat perusahaan merasa sakit kepala dalam pencarian dan analisis karena kurangnya format yang telah ditentukan sebelumnya.
Guillaume Lample, Kepala Ilmuwan di Mistral, mengatakan teknologinya adalah langkah kunci dalam mendorong penggunaan AI yang lebih luas di perusahaan, terutama untuk perusahaan yang ingin menyederhanakan akses ke dokumen internal. Mistral OCR sangat kuat dan komprehensif, mendukung berbagai bahasa, skrip dan tata letak dokumen, dan dapat mempertahankan elemen format dokumen, seperti judul, paragraf, daftar dan tabel, membuat teks yang diekstraksi lebih mudah ditindaklanjuti. Selain itu, pengguna dapat mengekstrak konten tertentu dan memformatnya menjadi format terstruktur seperti JSON atau Markdown, yang memfasilitasi integrasi dengan alur kerja yang digerakkan AI lainnya.
Mistral OCR tidak hanya berkinerja baik dalam fungsi, tetapi juga memiliki keunggulan kinerja yang signifikan. Menurut hasil benchmark, akurasinya dalam pengakuan matematika, pemindaian dokumen dan pemrosesan teks multibahasa melampaui pesaing utama termasuk Google Document AI, Azure OCR dan Openai GPT-4O. Yang lebih terpuji adalah bahwa kecepatan pemrosesan OCR Mistral juga luar biasa, dengan satu simpul memproses hingga 2.000 halaman per menit, menjadikannya ideal untuk industri seperti penelitian, layanan pelanggan, dan pelestarian dokumen historis yang membutuhkan pemrosesan sejumlah besar dokumen.
Untuk CEO perusahaan, CIO, CTO, manajer TI, dan pemimpin tim, Mistral OCR membawa efisiensi, keamanan, dan peluang skalabilitas yang signifikan untuk alur kerja yang didorong oleh dokumen. Dengan mengotomatisasi pemrosesan dokumen dan mengurangi entri data manual, Mistral OCR dapat mengurangi biaya manajemen dan menyederhanakan operasi. Terutama di industri dengan berbagai dokumen kertas seperti keuangan, perawatan medis, hukum dan kepatuhan, nilainya bahkan lebih menonjol. Selain itu, kemampuan pemahaman dokumen Mistral OCR dapat membantu pembuat keputusan mengekstraksi wawasan yang dapat ditindaklanjuti dari laporan, kontrak, dokumen keuangan dan makalah penelitian, meningkatkan keamanan dan kepatuhan data, dan dengan mudah berintegrasi dengan sistem perusahaan yang ada untuk produktivitas secara keseluruhan.
Saat ini, Mistral OCR dihargai 1.000 halaman per dolar, sedangkan penalaran batch adalah 2.000 halaman per dolar. API telah diluncurkan di platform pengembang Mistral La PlateForme. Pengguna juga dapat mencoba model secara gratis di situs web Mistral Le Chat untuk mengalami kekuatan "mata api" secara langsung. Mistral AI mengatakan model akan terus ditingkatkan berdasarkan umpan balik pengguna dalam beberapa minggu mendatang.
Peluncuran Mistral OCR menandai tahap baru dalam pengembangan teknologi OCR. Dengan menggabungkan OCR dengan pemahaman dokumen yang digerakkan oleh AI, Mistral membantu perusahaan mengekstrak, menganalisis, dan memanfaatkan dokumen mereka dengan cara yang lebih cerdas. Untuk perusahaan -perusahaan yang ingin membuat dokumen mereka "hidup", mereka mungkin juga mengalami "senjata rahasia" ini dari Prancis sesegera mungkin.