Vor dem Hintergrund des zunehmend heftigen Wettbewerbs in KI -Modellen hat das französische Startup Mistral eine API (optische Charaktererkennung) mit dem Namen Mistral OCR auf den Markt gebracht, um Unternehmen ein fortgeschritteneres Dokumentverständnis zu bieten. Dieses Tool extrahiert nicht nur Inhalte aus chaotischen PDFs und Bilddateien, sondern organisiert auch komplexe Elemente wie handgeschriebene Notizen, gedruckte Text, Bilder, Tabellen und Formeln in strukturierte Daten und bietet eine große Bequemlichkeit für Unternehmen, um massive unstrukturierte Daten zu verarbeiten.
Der Start von Mistral OCR markiert eine neue Entwicklungsphase in der OCR -Technologie. Es handelt sich nicht nur um ein einfaches Tool zur Erkennung von Texten, sondern auch ein Experte für Senior -Dokumenteninterpretation, der die Artensparungselemente und Merkmale verschiedener Dokumente verstehen kann, einschließlich Tabellen, mathematischer Ausdrücke und Bilder, die darin durchsetzt sind und die Struktur der Ausgabeergebnisse sicherstellen. Diese Fähigkeit ist besonders wichtig für Unternehmen, da bis zu 90% der Unternehmensinformationen in Form von unstrukturierten Daten wie E -Mails, Social -Media -Posts, Videos und Bildern vorhanden sind, bei denen Unternehmen aufgrund des Mangels an vordefinierten Formaten immer Unternehmen Kopfschmerzen in der Suche und Analyse empfinden.
Guillaume Lampe, Chefwissenschaftler bei Mistral, sagte, die Technologie sei ein wesentlicher Schritt, um die breitere Verwendung von KI in Unternehmen voranzutreiben, insbesondere für Unternehmen, die den Zugang zu internen Dokumenten vereinfachen möchten. Mistral OCR ist leistungsstark und umfassend, unterstützt mehrere Sprachen, Skripte und Dokumentlayouts und kann Formatelemente des Dokuments beibehalten, z. B. Titel, Absätze, Listen und Tabellen, wodurch extrahierter Text leichter zu folgen ist. Darüber hinaus können Benutzer bestimmte Inhalte extrahieren und in strukturierte Formate wie JSON oder Markdown formatieren, was die Integration in andere kI-gesteuerte Workflows erleichtert.
Mistral OCR hat nicht nur eine gute Funktion, sondern hat auch erhebliche Leistungsvorteile. Laut den Benchmark-Ergebnissen übertrifft die Genauigkeit der mathematischen Erkennung, des Dokuments und der mehrsprachigen Textverarbeitung große Wettbewerber, einschließlich Google Document AI, Azure OCR und OpenAs GPT-4O. Noch lobenswerter ist, dass die Verarbeitungsgeschwindigkeit von Mistral OCR auch erstaunlich ist, wobei eine einzelne Knotenverarbeitung von bis zu 2.000 Seiten pro Minute ideal für Branchen wie Forschung, Kundendienst und historische Dokumentenerhaltung ist, für die eine große Anzahl von Dokumenten verarbeitet werden muss.
Für Unternehmen, CIOs, CTOs, IT-Manager und Teamleiter, bringt Mistral OCR erhebliche Effizienz-, Sicherheits- und Skalierbarkeitsmöglichkeiten für dokumentgetriebene Workflows mit. Durch die Automatisierung der Dokumentenverarbeitung und Reduzierung der manuellen Dateneingabe kann Mistral OCR die Verwaltungskosten senken und den Vorgang vereinfachen. Insbesondere in Branchen mit einer Vielzahl von Papierdokumenten wie Finanzen, medizinischer Versorgung, Recht und Einhaltung ist ihr Wert noch deutlicher. Darüber hinaus können die Dokumentenverständnisfunktionen von Mistral OCR Entscheidungsträger dabei unterstützen, umsetzbare Erkenntnisse aus Berichten, Verträgen, Finanzdokumenten und Forschungsarbeiten, die Datensicherheit und -konformität zu verbessern und sich leicht in bestehende Unternehmenssysteme für die Gesamtproduktivität zu integrieren.
Derzeit kostet Mistral OCR 1.000 Seiten pro Dollar, während die Batch -Argumentation 2.000 Seiten pro Dollar beträgt. Die API wurde auf der Entwicklerplattform von Mistral La Plateforme gestartet. Benutzer können das Modell auch kostenlos auf der Website von Mistal von LE CHAT kostenlos ausprobieren, um die Kraft seiner "Feueraugen" aus erster Hand zu erleben. Mistral AI sagte, das Modell werde in den kommenden Wochen kontinuierlich verbessert.
Der Start von Mistral OCR markiert eine neue Bühne in der Entwicklung der OCR -Technologie. Durch die Kombination von OCR mit einem KI-gesteuerten Dokumentverständnis hilft Mistral Enterprises dabei, ihre Dokumente auf intelligentere Weise zu extrahieren, zu analysieren und zu nutzen. Für diejenigen Unternehmen, die ihre Dokumente als "live" machen möchten, können sie diese "Geheimwaffe" so schnell wie möglich genauso gut erleben.