En el contexto de la competencia cada vez más feroz en los modelos de IA, la startup francesa Mistral ha lanzado una API de reconocimiento óptico de carácter (OCR) llamada Mistral OCR, con el objetivo de proporcionar a las empresas una comprensión de documentos más avanzada. Esta herramienta no solo extrae contenido de PDF desordenados y archivos de imagen, sino que también organiza elementos complejos como notas escritas a mano, texto impreso, imágenes, tablas y fórmulas en datos estructurados, lo que proporciona una gran comodidad para las empresas para procesar datos no estructurados masivos.
El lanzamiento de Mistral OCR marca una nueva etapa de desarrollo en tecnología OCR. No es solo una herramienta simple de reconocimiento de texto, sino también un experto en interpretación de documentos senior que puede comprender los elementos tipos de compensación y las características de varios documentos, incluidas las tablas, las expresiones matemáticas y las imágenes intercaladas en el mismo, y garantizar la estructura de los resultados de la salida. Esta capacidad es particularmente importante para las empresas, porque hasta el 90% de la información empresarial existe en forma de datos no estructurados, como correos electrónicos, publicaciones en redes sociales, videos e imágenes, que siempre han hecho que las empresas se sientan dolores de cabeza en la búsqueda y análisis debido a la falta de formatos predefinidos.
Guillaume Lample, científico jefe de Mistral, dijo que la tecnología es un paso clave para impulsar el uso más amplio de la IA en las empresas, especialmente para las empresas que desean simplificar el acceso a documentos internos. Mistral OCR es poderoso e integral, que admite múltiples idiomas, scripts y diseños de documentos, y puede retener elementos de formato del documento, como títulos, párrafos, listas y tablas, lo que hace que el texto extraído sea más fácil de seguir. Además, los usuarios pueden extraer contenido específico y formatearlo en formatos estructurados como JSON o Markdown, lo que facilita la integración con otros flujos de trabajo impulsados por la IA.
Mistral OCR no solo funciona bien en función, sino que también tiene ventajas significativas en el rendimiento. Según los resultados de referencia, su precisión en el reconocimiento matemático, el escaneo de documentos y el procesamiento de textos multilingües supera a los principales competidores, incluidas Google Document AI, Azure OCR y el GPT-4O de OpenAI. Lo que es aún más encomiable es que la velocidad de procesamiento de OCR mistral también es sorprendente, con un solo nodo que procesa hasta 2,000 páginas por minuto, lo que la hace ideal para industrias como la investigación, el servicio al cliente y la preservación de documentos históricos que requieren procesar una gran cantidad de documentos.
Para los CEOs, CIO, CTO, gerentes de TI y líderes de equipo de empresas, OCR Mistral brindan oportunidades significativas de eficiencia, seguridad y escalabilidad para los flujos de trabajo impulsados por documentos. Al automatizar el procesamiento de documentos y la reducción de la entrada de datos manuales, Mistral OCR puede reducir los costos de gestión y simplificar las operaciones. Especialmente en las industrias con una amplia gama de documentos en papel como finanzas, atención médica, legal y cumplimiento, su valor es aún más prominente. Además, las capacidades de comprensión de documentos de Mistral OCR pueden ayudar a los tomadores de decisiones a extraer información procesable de informes, contratos, documentos financieros y documentos de investigación, mejorar la seguridad y el cumplimiento de los datos, e integrarse fácilmente con los sistemas empresariales existentes para la productividad general.
Actualmente, Mistral OCR tiene un precio de 1,000 páginas por dólar, mientras que el razonamiento por lotes es de 2,000 páginas por dólar. La API se ha lanzado en la plataforma de desarrollador de Mistral, La PlateForme. Los usuarios también pueden probar el modelo de forma gratuita en el sitio web de Mistral, LE Chat para experimentar el poder de sus "ojos de fuego" de primera mano. Mistral AI dijo que el modelo mejorará continuamente según los comentarios de los usuarios en las próximas semanas.
El lanzamiento de Mistral OCR marca una nueva etapa en el desarrollo de la tecnología OCR. Al combinar OCR con la comprensión de documentos impulsada por la IA, Mistral está ayudando a las empresas a extraer, analizar y utilizar sus documentos de manera más inteligente. Para aquellas compañías que desean hacer que sus documentos sean "en vivo", también podrían experimentar este "arma secreta" de Francia lo antes posible.