เมื่อเทียบกับฉากหลังของการแข่งขันที่ดุเดือดมากขึ้นในโมเดล AI, Mistral Startup French ได้เปิดตัว API การจดจำอักขระแบบออพติคอล (OCR) ที่เรียกว่า Mistral OCR โดยมีวัตถุประสงค์เพื่อให้องค์กรมีความเข้าใจในเอกสารขั้นสูงมากขึ้น เครื่องมือนี้ไม่เพียง แต่แยกเนื้อหาจากไฟล์ PDFs และไฟล์รูปภาพที่ยุ่งเหยิง แต่ยังจัดองค์ประกอบที่ซับซ้อนเช่นบันทึกย่อที่เขียนด้วยลายมือข้อความที่พิมพ์รูปภาพตารางและสูตรลงในข้อมูลที่มีโครงสร้างซึ่งให้ความสะดวกสบายอย่างมากสำหรับองค์กรต่างๆในการประมวลผลข้อมูลที่ไม่มีโครงสร้างจำนวนมาก
การเปิดตัว Mistral OCR เป็นขั้นตอนใหม่ของการพัฒนาในเทคโนโลยี OCR มันไม่ได้เป็นเพียงเครื่องมือจดจำข้อความที่เรียบง่าย แต่ยังเป็นผู้เชี่ยวชาญด้านการตีความเอกสารอาวุโสที่สามารถเข้าใจองค์ประกอบการเรียงพิมพ์และคุณสมบัติของเอกสารต่าง ๆ รวมถึงตารางการแสดงออกทางคณิตศาสตร์และรูปภาพสลับกันในนั้นและตรวจสอบโครงสร้างของผลลัพธ์ผลลัพธ์ ความสามารถนี้มีความสำคัญอย่างยิ่งสำหรับองค์กรเนื่องจากมีข้อมูลระดับองค์กรมากถึง 90% ในรูปแบบของข้อมูลที่ไม่มีโครงสร้างเช่นอีเมลโพสต์โซเชียลมีเดียวิดีโอและรูปภาพซึ่งทำให้ บริษัท ต่างๆรู้สึกปวดหัวในการค้นหาและวิเคราะห์เนื่องจากขาดรูปแบบที่กำหนดไว้ล่วงหน้า
Guillaume Lample หัวหน้านักวิทยาศาสตร์ของ Mistral กล่าวว่าเทคโนโลยีเป็นขั้นตอนสำคัญในการผลักดันการใช้ AI ในองค์กรที่กว้างขึ้นโดยเฉพาะอย่างยิ่งสำหรับ บริษัท ที่ต้องการลดการเข้าถึงเอกสารภายใน Mistral OCR นั้นมีประสิทธิภาพและครอบคลุมสนับสนุนหลายภาษาสคริปต์และเค้าโครงเอกสารและสามารถรักษาองค์ประกอบรูปแบบของเอกสารเช่นชื่อเรื่องย่อหน้ารายการและตารางทำให้ข้อความที่สกัดง่ายขึ้นในการติดตาม นอกจากนี้ผู้ใช้สามารถแยกเนื้อหาเฉพาะและจัดรูปแบบลงในรูปแบบที่มีโครงสร้างเช่น JSON หรือ Markdown ซึ่งอำนวยความสะดวกในการรวมเข้ากับเวิร์กโฟลว์ AI อื่น ๆ
Mistral OCR ไม่เพียง แต่ทำงานได้ดีในการทำงาน แต่ยังมีข้อได้เปรียบที่สำคัญในการปฏิบัติงาน ตามผลการวัดความถูกต้องในการรับรู้ทางคณิตศาสตร์การสแกนเอกสารและการประมวลผลข้อความหลายภาษาเกินกว่าคู่แข่งรายใหญ่รวมถึง Google Document AI, Azure OCR และ GPT-4O ของ OpenAI สิ่งที่น่ายกย่องยิ่งกว่าคือความเร็วในการประมวลผลของ Mistral OCR นั้นน่าทึ่งเช่นกันด้วยโหนดเดียวที่ประมวลผลได้สูงถึง 2,000 หน้าต่อนาทีทำให้เหมาะสำหรับอุตสาหกรรมเช่นการวิจัยการบริการลูกค้าและการเก็บรักษาเอกสารทางประวัติศาสตร์ที่ต้องดำเนินการเอกสารจำนวนมาก
สำหรับซีอีโอขององค์กรซีไอโอซีไอโอ CTOs ผู้จัดการไอทีและผู้นำทีม Mistral OCR นำประสิทธิภาพความปลอดภัยและโอกาสที่จะปรับขนาดได้อย่างมีนัยสำคัญมาสู่เวิร์กโฟลว์ที่ขับเคลื่อนด้วยเอกสาร ด้วยการประมวลผลเอกสารโดยอัตโนมัติและลดการป้อนข้อมูลด้วยตนเอง Mistral OCR สามารถลดต้นทุนการจัดการและทำให้การดำเนินงานง่ายขึ้น โดยเฉพาะอย่างยิ่งในอุตสาหกรรมที่มีเอกสารกระดาษที่หลากหลายเช่นการเงินการดูแลทางการแพทย์กฎหมายและการปฏิบัติตามมูลค่าของมันมีความโดดเด่นยิ่งขึ้น นอกจากนี้ความสามารถในการทำความเข้าใจเอกสารของ Mistral OCR สามารถช่วยผู้มีอำนาจตัดสินใจที่ดึงข้อมูลเชิงลึกที่สามารถดำเนินการได้จากรายงานสัญญาเอกสารทางการเงินและเอกสารการวิจัยปรับปรุงความปลอดภัยของข้อมูลและการปฏิบัติตามและรวมเข้ากับระบบองค์กรที่มีอยู่ได้อย่างง่ายดาย
ปัจจุบัน Mistral OCR มีราคาอยู่ที่ 1,000 หน้าต่อดอลลาร์ในขณะที่การใช้เหตุผลแบบแบทช์คือ 2,000 หน้าต่อดอลลาร์ API ได้รับการเปิดตัวบนแพลตฟอร์มนักพัฒนาของ Mistral La Plateforme ผู้ใช้ยังสามารถลองใช้โมเดลได้ฟรีบนเว็บไซต์ของ Mistral Le Chat เพื่อสัมผัสพลังของ "Fire Eyes" โดยตรง Mistral AI กล่าวว่าแบบจำลองจะได้รับการปรับปรุงอย่างต่อเนื่องตามข้อเสนอแนะของผู้ใช้ในอีกไม่กี่สัปดาห์ข้างหน้า
การเปิดตัว Mistral OCR เป็นขั้นตอนใหม่ในการพัฒนาเทคโนโลยี OCR ด้วยการรวม OCR เข้ากับความเข้าใจในเอกสารที่ขับเคลื่อนด้วย AI Mistral กำลังช่วยให้องค์กรสกัดวิเคราะห์และใช้เอกสารของพวกเขาอย่างชาญฉลาด สำหรับ บริษัท เหล่านั้นที่ต้องการสร้างเอกสารของพวกเขา "มีชีวิต" พวกเขาอาจได้สัมผัสกับ "อาวุธลับ" นี้จากฝรั่งเศสโดยเร็วที่สุด