على خلفية المنافسة الشرسة بشكل متزايد في نماذج الذكاء الاصطناعى ، أطلقت شركة Mistral French Startup واجهة برمجة تطبيقات بصرية التعرف على الشخصيات (OCR) تسمى Mistral OCR ، بهدف تزويد المؤسسات بفهم وثيقة أكثر تقدماً. لا تستخرج هذه الأداة المحتوى من PDFs وملفات الصور الفوضوية فحسب ، بل تنظم أيضًا عناصر معقدة مثل الملاحظات المكتوبة بخط اليد والنص المطبوع والصور والجداول والصيغ في بيانات منظمة ، مما يوفر راحة كبيرة للمؤسسات لمعالجة البيانات الضخمة غير المنظمة.
يمثل إطلاق Mistral OCR مرحلة جديدة من التطوير في تكنولوجيا التعرف الضوئي على الحروف. إنها ليست فقط أداة التعرف على النص البسيطة ، ولكن أيضًا خبيرًا كبيرًا في تفسير الوثائق يمكنه فهم عناصر التنضيد وميزات المستندات المختلفة ، بما في ذلك الجداول ، والتعبيرات الرياضية ، والصور المتخلفة فيها ، وضمان بنية نتائج الإخراج. هذه الإمكانية مهمة بشكل خاص للمؤسسات ، لأن ما يصل إلى 90 ٪ من معلومات المؤسسات موجودة في شكل بيانات غير منظمة ، مثل رسائل البريد الإلكتروني ، ووسائل الإعلام الاجتماعية ، ومقاطع الفيديو والصور ، والتي جعلت الشركات دائمًا تشعر بالصداع في البحث والتحليل بسبب عدم وجود تنسيقات محددة مسبقًا.
وقال Guillaume Lample ، كبير العلماء في MISTRAL ، إن التكنولوجيا هي خطوة أساسية في قيادة الاستخدام الأوسع لمنظمة العفو الدولية في المؤسسات ، خاصة بالنسبة للشركات التي ترغب في تبسيط الوصول إلى المستندات الداخلية. تعتبر Mistral OCR قوية وشاملة ، وتدعم اللغات المتعددة والبرامج النصية وتخطيطات المستندات ، ويمكنها الاحتفاظ عناصر تنسيق الوثيقة ، مثل العناوين والفقرات والقوائم والجداول ، مما يجعل النص المستخرج أسهل في المتابعة. بالإضافة إلى ذلك ، يمكن للمستخدمين استخراج محتوى معين وتنسيقه في تنسيقات منظمة مثل JSON أو Markdown ، مما يسهل التكامل مع مهام سير العمل الأخرى التي تحركها AI.
لا يعمل OCR Mistral بشكل جيد في الوظيفة فحسب ، بل يتمتع أيضًا بمزايا كبيرة في الأداء. وفقًا للنتائج القياسية ، فإن دقتها في الاعتراف الرياضي ومسح المستندات ومعالجة النصوص المتعددة اللغات تتجاوز المنافسين الرئيسيين بما في ذلك Google Document AI و Azure OCR و GPT-4O من Openai. الأمر الأكثر جدارة بالثناء هو أن سرعة المعالجة لـ OCR الخاطئ مدهشة أيضًا ، حيث تقوم عقدة واحدة بمعالجة ما يصل إلى 2000 صفحة في الدقيقة ، مما يجعلها مثالية للصناعات مثل البحث وخدمة العملاء والحفاظ على المستندات التاريخية التي تتطلب معالجة عدد كبير من المستندات.
بالنسبة إلى المديرين التنفيذيين للمؤسسات ، ومديرات تخدير مديري المعلومات ، ومديري تكنولوجيا المعلومات ، ومديري تكنولوجيا المعلومات ، وقادة الفريق ، يجلب سوء المعرفة الضوئية كفاءة كبيرة وأمن وقابلية للتوسع لتوثيق سير العمل. من خلال أتمتة معالجة المستندات وتقليل إدخال البيانات اليدوي ، يمكن لـ MISTRAL OCR تقليل تكاليف الإدارة وتبسيط العمليات. خاصة في الصناعات التي لديها مجموعة واسعة من المستندات الورقية مثل التمويل والرعاية الطبية والقانونية والامتثال ، فإن قيمتها أكثر بروزًا. بالإضافة إلى ذلك ، يمكن أن تساعد إمكانات فهم الوثائق في Mistral OCR على استخراج رؤى قابلة للتنفيذ من التقارير والعقود والوثائق المالية والأوراق البحثية ، وتحسين أمان البيانات والامتثال ، والتكامل بسهولة مع أنظمة المؤسسات الحالية من أجل الإنتاجية الشاملة.
حاليًا ، يبلغ سعر MISTRAL OCR 1000 صفحة لكل دولار ، في حين أن التفكير في الدُفعات هو 2000 صفحة لكل دولار. تم إطلاق واجهة برمجة التطبيقات على منصة مطور Mistral La Plateforme. يمكن للمستخدمين أيضًا تجربة النموذج مجانًا على موقع Mistral الخاص بـ Le Chat لتجربة قوة "Fire Eyes" بشكل مباشر. قال Mistral AI إنه سيتم تحسين النموذج بشكل مستمر بناءً على ملاحظات المستخدم في الأسابيع المقبلة.
يمثل إطلاق Mistral OCR مرحلة جديدة في تطوير تكنولوجيا التعرف الضوئي على الحروف. من خلال الجمع بين OCR مع فهم الوثائق التي تعتمد على AI ، تساعد MISTRALS Enterprises على استخراج مستنداتها وتحليلها واستخدامها بطريقة أكثر ذكاءً. بالنسبة لتلك الشركات التي ترغب في جعل مستنداتها "حية" ، قد تجربة هذا "السلاح السري" من فرنسا في أقرب وقت ممكن.