Dans le contexte d'une concurrence de plus en plus féroce dans les modèles d'IA, la startup française Mistral a lancé une API de reconnaissance de caractères optiques (OCR) appelée Mistral OCR, visant à fournir aux entreprises une compréhension de documents plus avancée. Cet outil extrait non seulement le contenu des PDF désordonnés et des fichiers d'image, mais organise également des éléments complexes tels que des notes manuscrites, du texte imprimé, des images, des tables et des formules en données structurées, offrant une grande commodité aux entreprises pour traiter des données massives non structurées.
Le lancement de Mistral OCR marque une nouvelle étape de développement dans la technologie OCR. Ce n'est pas seulement un simple outil de reconnaissance de texte, mais aussi un expert en interprétation de documents senior qui peut comprendre les éléments et les caractéristiques de composition de divers documents, y compris les tableaux, les expressions mathématiques et les images qui y sont entrecoupées, et assurer la structure des résultats de sortie. Cette capacité est particulièrement importante pour les entreprises, car jusqu'à 90% des informations d'entreprise existent sous la forme de données non structurées, telles que des e-mails, des publications de médias sociaux, des vidéos et des images, qui ont toujours fait ressentir des maux de tête en recherche et en analyse en raison du manque de formats prédéfinis.
Guillaume Lample, scientifique en chef de Mistral, a déclaré que la technologie est une étape clé dans la conduite de l'utilisation plus large de l'IA dans les entreprises, en particulier pour les entreprises qui souhaitent simplifier l'accès aux documents internes. Mistral OCR est puissant et complet, prenant en charge plusieurs langues, scripts et dispositions de documents, et peut conserver des éléments de format du document, tels que des titres, des paragraphes, des listes et des tableaux, ce qui rend le texte extrait plus facile à suivre. De plus, les utilisateurs peuvent extraire du contenu spécifique et le formater en formats structurés tels que JSON ou Markdown, ce qui facilite l'intégration avec d'autres flux de travail axés sur l'IA.
Mistral OCR fonctionne non seulement bien en fonction, mais présente également des avantages importants dans les performances. Selon les résultats de référence, sa précision de reconnaissance mathématique, de numérisation des documents et de traitement de texte multilingue dépasse les concurrents majeurs, notamment Google Document AI, Azure OCR et GPT-4O d'OpenAI. Ce qui est encore plus louable, c'est que la vitesse de traitement de Mistral OCR est également incroyable, avec un nœud unique traitant jusqu'à 2 000 pages par minute, ce qui le rend idéal pour des industries telles que la recherche, le service client et la préservation des documents historiques qui nécessitent le traitement d'un grand nombre de documents.
Pour les PDG des entreprises, les DSI, les CTO, les responsables informatiques et les chefs d'équipe, Mistral OCR offre des opportunités d'efficacité, de sécurité et d'évolutivité importantes pour les flux de travail axés sur les documents. En automatisant le traitement des documents et la réduction de la saisie des données manuelles, Mistral OCR peut réduire les coûts de gestion et simplifier les opérations. En particulier dans les industries avec un large éventail de documents papier tels que la finance, les soins médicaux, le juridique et la conformité, sa valeur est encore plus importante. De plus, les capacités de compréhension des documents de Mistral OCR peuvent aider les décideurs à extraire des informations exploitables des rapports, des contrats, des documents financiers et des documents de recherche, améliorer la sécurité et la conformité des données, et s'intègre facilement aux systèmes d'entreprise existants pour la productivité globale.
Actuellement, Mistral OCR est au prix de 1 000 pages par dollar, tandis que le raisonnement par lots est de 2 000 pages par dollar. L'API a été lancée sur la plate-forme de développeur de Mistral, La Plateforme. Les utilisateurs peuvent également essayer le modèle gratuitement sur le site Web de Mistral Le Chat pour découvrir la puissance de ses "yeux de feu" de première main. Mistral AI a déclaré que le modèle sera continuellement amélioré en fonction des commentaires des utilisateurs dans les semaines à venir.
Le lancement de Mistral OCR marque une nouvelle étape dans le développement de la technologie OCR. En combinant l'OCR avec la compréhension des documents dirigés par l'IA, Mistral aide les entreprises à extraire, analyser et utiliser leurs documents de manière plus intelligente. Pour les entreprises qui veulent faire leurs documents "en direct", elles pourraient aussi bien vivre cette "arme secrète" de la France dès que possible.