เอกสาร การติดตั้ง ? Model Zoo | อัปเดตข่าว | ปัญหาการรายงาน
ภาษาอังกฤษ | 简体中文











สาขาเริ่มต้นตอนนี้เป็น main และรหัสในสาขาได้รับการอัพเกรดเป็น v1.0.0 รหัสสาขา main เก่า (v0.6.3) ตอนนี้มีอยู่ในสาขา 0.x หากคุณใช้สาขา main และพบปัญหาการอัพเกรดโปรดอ่านคู่มือการโยกย้ายและบันทึกเกี่ยวกับสาขา
V1.0.0 เปิดตัวในปี 2023-04-06 การอัปเดตที่สำคัญจาก 1.0.0RC6 รวมถึง:
หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับการอัปเดตใน MMOCR 1.0 โปรดดูสิ่งใหม่ใน MMOCR 1.x หรืออ่าน Changelog สำหรับรายละเอียดเพิ่มเติม!
MMOCR เป็นกล่องเครื่องมือโอเพนซอร์ซที่ใช้ Pytorch และ MMDetection สำหรับการตรวจจับข้อความการจดจำข้อความและงานดาวน์สตรีมที่สอดคล้องกันรวมถึงการแยกข้อมูลคีย์ มันเป็นส่วนหนึ่งของโครงการ OpenMMLAB
สาขาหลักทำงานร่วมกับ Pytorch 1.6+

ไปป์ไลน์ที่ครอบคลุม
กล่องเครื่องมือไม่เพียง แต่รองรับการตรวจจับข้อความและการจดจำข้อความ แต่ยังรวมถึงงานดาวน์สตรีมเช่นการแยกข้อมูลคีย์
หลายรุ่น
กล่องเครื่องมือรองรับโมเดลที่ทันสมัยที่หลากหลายสำหรับการตรวจจับข้อความการจดจำข้อความและการแยกข้อมูลที่สำคัญ
การออกแบบแบบแยกส่วน
การออกแบบแบบแยกส่วนของ MMOCR ช่วยให้ผู้ใช้สามารถกำหนดตัวเพิ่มประสิทธิภาพของตัวเองตัวประมวลผลข้อมูลและส่วนประกอบของแบบจำลองเช่นแบ็คโบนคอและหัวรวมถึงการสูญเสีย โปรดดูภาพรวมสำหรับวิธีการสร้างโมเดลที่กำหนดเอง
สาธารณูปโภคมากมาย
กล่องเครื่องมือจัดเตรียมชุดยูทิลิตี้ที่ครอบคลุมซึ่งสามารถช่วยให้ผู้ใช้ประเมินประสิทธิภาพของโมเดล มันรวมถึง Visualizers ที่อนุญาตให้สร้างภาพของภาพความจริงพื้นดินรวมถึงกล่องที่คาดการณ์ไว้และเครื่องมือตรวจสอบความถูกต้องสำหรับการประเมินจุดตรวจในระหว่างการฝึกอบรม นอกจากนี้ยังรวมถึงตัวแปลงข้อมูลเพื่อสาธิตวิธีการแปลงข้อมูลของคุณเองเป็นไฟล์คำอธิบายประกอบที่กล่องเครื่องมือรองรับ
MMOCH ขึ้นอยู่กับ pytorch, mmengine, MMCV และ mmdetection ด้านล่างเป็นขั้นตอนที่รวดเร็วสำหรับการติดตั้ง โปรดดูคู่มือการติดตั้งสำหรับคำสั่งโดยละเอียดเพิ่มเติม
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . โปรดดูการวิ่งอย่างรวดเร็วสำหรับการใช้งานขั้นพื้นฐานของ MMOCR
อัลกอริทึมที่รองรับ:
โปรดดูที่ model_zoo สำหรับรายละเอียดเพิ่มเติม
นี่คือการใช้งานของโมเดล SOTA และโซลูชั่นที่สร้างขึ้นบน MMOCR ซึ่งได้รับการสนับสนุนและดูแลโดยผู้ใช้ชุมชน โครงการเหล่านี้แสดงให้เห็นถึงแนวทางปฏิบัติที่ดีที่สุดโดยใช้ MMOCR สำหรับการวิจัยและการพัฒนาผลิตภัณฑ์ เรายินดีต้อนรับและชื่นชมการมีส่วนร่วมทั้งหมดในระบบนิเวศ OpenMMLAB
เราขอขอบคุณการมีส่วนร่วมทั้งหมดเพื่อปรับปรุง MMOCR โปรดดูที่การสนับสนุน. MD สำหรับแนวทางที่มีส่วนร่วม
MMOCR เป็นโครงการโอเพ่นซอร์สที่ได้รับการสนับสนุนจากนักวิจัยและวิศวกรจากวิทยาลัยและ บริษัท ต่างๆ เราขอขอบคุณผู้สนับสนุนทุกคนที่ใช้วิธีการของพวกเขาหรือเพิ่มคุณสมบัติใหม่รวมถึงผู้ใช้ที่ให้ข้อเสนอแนะที่มีค่า เราหวังว่ากล่องเครื่องมือและเกณฑ์มาตรฐานสามารถให้บริการชุมชนการวิจัยที่กำลังเติบโตโดยการจัดหาชุดเครื่องมือที่ยืดหยุ่นในการปรับปรุงวิธีการที่มีอยู่ใหม่และพัฒนาวิธีการ OCR ใหม่ของตนเอง
หากคุณพบว่าโครงการนี้มีประโยชน์ในการวิจัยของคุณโปรดพิจารณาอ้างอิง:
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}โครงการนี้เปิดตัวภายใต้ใบอนุญาต Apache 2.0
สแกนรหัส QR ด้านล่างเพื่อติดตาม บัญชีทางการ ของทีม OpenMMLAB และเข้าร่วม กลุ่ม QQ ของทีม OpenMMLAB หรือเข้าร่วมการสื่อสารอย่างเป็นทางการ WeChat Group โดยการเพิ่ม WeChat หรือเข้าร่วม Slack ของเรา
เราจะจัดหาชุมชน OpenMMLAB ให้คุณ
ชุมชน OpenMMLAB ตั้งตารอการเข้าร่วมของคุณ! -