No contexto de uma competição cada vez mais feroz nos modelos de IA, a startup francesa Mistral lançou uma API de reconhecimento de caracteres ópticos (OCR) chamado Mistral OCR, com o objetivo de fornecer às empresas uma compreensão de documentos mais avançada. Essa ferramenta não apenas extrai conteúdo de PDFs e arquivos de imagem confusos, mas também organiza elementos complexos, como notas manuscritas, texto impresso, imagens, tabelas e fórmulas em dados estruturados, proporcionando grande conveniência para as empresas processarem dados não estruturados maciços.
O lançamento do Mistral OCR marca um novo estágio de desenvolvimento na tecnologia OCR. Não é apenas uma ferramenta de reconhecimento de texto simples, mas também um especialista em interpretação de documentos sênior que pode entender os elementos e recursos de vários documentos, incluindo tabelas, expressões matemáticas e imagens intercaladas e garantir a estrutura dos resultados da saída. Esse recurso é particularmente importante para as empresas, porque existem até 90% das informações da empresa na forma de dados não estruturados, como e -mails, postagens de mídia social, vídeos e imagens, que sempre fizeram as empresas sentirem dores de cabeça em pesquisa e análise devido à falta de formatos predefinidos.
Guillaume Lample, cientista -chefe da Mistral, disse que a tecnologia é uma etapa essencial para impulsionar o uso mais amplo da IA nas empresas, especialmente para empresas que desejam simplificar o acesso a documentos internos. O Mistral OCR é poderoso e abrangente, apoiando vários idiomas, scripts e layouts de documentos, e pode reter elementos de formato do documento, como títulos, parágrafos, listas e tabelas, facilitando o acompanhamento do texto extraído. Além disso, os usuários podem extrair conteúdo específico e formatá-lo em formatos estruturados, como JSON ou Markdown, o que facilita a integração com outros fluxos de trabalho orientados a IA.
O Mistral OCR não apenas tem um bom desempenho em função, mas também tem vantagens significativas no desempenho. De acordo com os resultados da referência, sua precisão no reconhecimento matemático, a digitalização de documentos e o processamento multilíngue de texto supera os principais concorrentes, incluindo o Google Document AI, o Azure OCR e o OpenAI do GPT-4O. O que é ainda mais louvável é que a velocidade de processamento do Mistral OCR também é incrível, com um único processamento de nó até 2.000 páginas por minuto, tornando -o ideal para indústrias como pesquisa, atendimento ao cliente e preservação histórica de documentos que exigem o processamento de um grande número de documentos.
Para CEOs corporativos, CIOs, CTOs, gerentes de TI e líderes de equipe, o Mistral OCR traz oportunidades significativas de eficiência, segurança e escalabilidade para os fluxos de trabalho orientados por documentar. Ao automatizar o processamento de documentos e reduzir a entrada de dados manuais, o MISTRAL OCR pode reduzir os custos de gerenciamento e simplificar as operações. Especialmente em indústrias com uma ampla gama de documentos em papel, como finanças, assistência médica, legal e conformidade, seu valor é ainda mais proeminente. Além disso, os recursos de compreensão de documentos da Mistral OCR podem ajudar os tomadores de decisão a extrair informações acionáveis de relatórios, contratos, documentos financeiros e documentos de pesquisa, melhorar a segurança e a conformidade de dados e se integrar facilmente aos sistemas corporativos existentes para a produtividade geral.
Atualmente, o Mistral OCR custa 1.000 páginas por dólar, enquanto o raciocínio em lote é de 2.000 páginas por dólar. A API foi lançada na plataforma de desenvolvedores da Mistral, La Plateforme. Os usuários também podem experimentar o modelo gratuitamente no site da Mistral, Le Chat para experimentar o poder de seus "olhos de fogo" em primeira mão. A IA Mistral disse que o modelo será continuamente melhorado com base no feedback do usuário nas próximas semanas.
O lançamento do Mistral OCR marca um novo estágio no desenvolvimento da tecnologia OCR. Ao combinar o OCR com o entendimento do documento orientado a IA, o Mistral está ajudando as empresas a extrair, analisar e utilizar seus documentos de maneira mais inteligente. Para as empresas que desejam fazer seus documentos "vivem", elas também podem experimentar essa "arma secreta" da França o mais rápido possível.