mmocr mmocr

mmocr

หลาม

v1.0.1

ดาวน์โหลด

เอกสาร การติดตั้ง ? Model Zoo | อัปเดตข่าว | ปัญหาการรายงาน

ภาษาอังกฤษ | 简体中文

อัปเดตล่าสุด

สาขาเริ่มต้นตอนนี้เป็น main และรหัสในสาขาได้รับการอัพเกรดเป็น v1.0.0 รหัสสาขา main เก่า (v0.6.3) ตอนนี้มีอยู่ในสาขา 0.x หากคุณใช้สาขา main และพบปัญหาการอัพเกรดโปรดอ่านคู่มือการโยกย้ายและบันทึกเกี่ยวกับสาขา

V1.0.0 เปิดตัวในปี 2023-04-06 การอัปเดตที่สำคัญจาก 1.0.0RC6 รวมถึง:

สนับสนุนชุดข้อมูล SCUT-CTW1500, SynthText และ MJSynth ในชุดข้อมูลชุดข้อมูล
อัปเดตคำถามที่พบบ่อยและเอกสารประกอบ
การคัดค้าน file_client_args ในความโปรดปรานของ backend_args
เพิ่มสมุดบันทึกการสอน MMOCR ใหม่

หากต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับการอัปเดตใน MMOCR 1.0 โปรดดูสิ่งใหม่ใน MMOCR 1.x หรืออ่าน Changelog สำหรับรายละเอียดเพิ่มเติม!

การแนะนำ

MMOCR เป็นกล่องเครื่องมือโอเพนซอร์ซที่ใช้ Pytorch และ MMDetection สำหรับการตรวจจับข้อความการจดจำข้อความและงานดาวน์สตรีมที่สอดคล้องกันรวมถึงการแยกข้อมูลคีย์ มันเป็นส่วนหนึ่งของโครงการ OpenMMLAB

สาขาหลักทำงานร่วมกับ Pytorch 1.6+

คุณสมบัติที่สำคัญ

ไปป์ไลน์ที่ครอบคลุม
กล่องเครื่องมือไม่เพียง แต่รองรับการตรวจจับข้อความและการจดจำข้อความ แต่ยังรวมถึงงานดาวน์สตรีมเช่นการแยกข้อมูลคีย์
หลายรุ่น
กล่องเครื่องมือรองรับโมเดลที่ทันสมัยที่หลากหลายสำหรับการตรวจจับข้อความการจดจำข้อความและการแยกข้อมูลที่สำคัญ
การออกแบบแบบแยกส่วน
การออกแบบแบบแยกส่วนของ MMOCR ช่วยให้ผู้ใช้สามารถกำหนดตัวเพิ่มประสิทธิภาพของตัวเองตัวประมวลผลข้อมูลและส่วนประกอบของแบบจำลองเช่นแบ็คโบนคอและหัวรวมถึงการสูญเสีย โปรดดูภาพรวมสำหรับวิธีการสร้างโมเดลที่กำหนดเอง
สาธารณูปโภคมากมาย
กล่องเครื่องมือจัดเตรียมชุดยูทิลิตี้ที่ครอบคลุมซึ่งสามารถช่วยให้ผู้ใช้ประเมินประสิทธิภาพของโมเดล มันรวมถึง Visualizers ที่อนุญาตให้สร้างภาพของภาพความจริงพื้นดินรวมถึงกล่องที่คาดการณ์ไว้และเครื่องมือตรวจสอบความถูกต้องสำหรับการประเมินจุดตรวจในระหว่างการฝึกอบรม นอกจากนี้ยังรวมถึงตัวแปลงข้อมูลเพื่อสาธิตวิธีการแปลงข้อมูลของคุณเองเป็นไฟล์คำอธิบายประกอบที่กล่องเครื่องมือรองรับ

การติดตั้ง

MMOCH ขึ้นอยู่กับ pytorch, mmengine, MMCV และ mmdetection ด้านล่างเป็นขั้นตอนที่รวดเร็วสำหรับการติดตั้ง โปรดดูคู่มือการติดตั้งสำหรับคำสั่งโดยละเอียดเพิ่มเติม

conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e .

เริ่มต้นใช้งาน

โปรดดูการวิ่งอย่างรวดเร็วสำหรับการใช้งานขั้นพื้นฐานของ MMOCR

สวนสัตว์รุ่น

อัลกอริทึมที่รองรับ:

กระดูกสันหลัง

OCLIP (ECCV'2022)

การตรวจจับข้อความ

การจดจำข้อความ

Abinet (cvpr'2021)
ASTER (TPAMI'2018)
crnn (tpami'2016)
อาจารย์ (Pr'2021)
NRTR (ICDAR'2019)
RobustScanner (ECCV'2020)
SAR (Aaai'2019)
SATRN (CVPR'2020 เวิร์กช็อปเกี่ยวกับข้อความและเอกสารในยุคการเรียนรู้ลึก)
svtr (ijcai'2022)

การแยกข้อมูลสำคัญ

SDMG-R (Arxiv'2021)

การระบุข้อความ

abcnet (cvpr'2020)
abcnetv2 (tpami'2021)
SPTS (ACM MM'2022)

โปรดดูที่ model_zoo สำหรับรายละเอียดเพิ่มเติม

โครงการ

นี่คือการใช้งานของโมเดล SOTA และโซลูชั่นที่สร้างขึ้นบน MMOCR ซึ่งได้รับการสนับสนุนและดูแลโดยผู้ใช้ชุมชน โครงการเหล่านี้แสดงให้เห็นถึงแนวทางปฏิบัติที่ดีที่สุดโดยใช้ MMOCR สำหรับการวิจัยและการพัฒนาผลิตภัณฑ์ เรายินดีต้อนรับและชื่นชมการมีส่วนร่วมทั้งหมดในระบบนิเวศ OpenMMLAB

การบริจาค

เราขอขอบคุณการมีส่วนร่วมทั้งหมดเพื่อปรับปรุง MMOCR โปรดดูที่การสนับสนุน. MD สำหรับแนวทางที่มีส่วนร่วม

การรับทราบ

MMOCR เป็นโครงการโอเพ่นซอร์สที่ได้รับการสนับสนุนจากนักวิจัยและวิศวกรจากวิทยาลัยและ บริษัท ต่างๆ เราขอขอบคุณผู้สนับสนุนทุกคนที่ใช้วิธีการของพวกเขาหรือเพิ่มคุณสมบัติใหม่รวมถึงผู้ใช้ที่ให้ข้อเสนอแนะที่มีค่า เราหวังว่ากล่องเครื่องมือและเกณฑ์มาตรฐานสามารถให้บริการชุมชนการวิจัยที่กำลังเติบโตโดยการจัดหาชุดเครื่องมือที่ยืดหยุ่นในการปรับปรุงวิธีการที่มีอยู่ใหม่และพัฒนาวิธีการ OCR ใหม่ของตนเอง

การอ้างอิง

หากคุณพบว่าโครงการนี้มีประโยชน์ในการวิจัยของคุณโปรดพิจารณาอ้างอิง:

 @article { mmocr2022 ,
    title = { MMOCR:  A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
    author = { MMOCR Developer Team } ,
    howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
    year = { 2022 }
}

ใบอนุญาต

โครงการนี้เปิดตัวภายใต้ใบอนุญาต Apache 2.0

ครอบครัว openmmlab

MMENGINE: OpenMMLAB Library สำหรับการฝึกอบรมแบบจำลองการเรียนรู้ลึก
MMCV: ห้องสมุดพื้นฐาน OpenMMLAB สำหรับการมองเห็นคอมพิวเตอร์
MIM: MIM ติดตั้งแพ็คเกจ OpenMMLAB
MMClassification: OpenMMLAB การจำแนกภาพกล่องเครื่องมือและเบนช์มาร์ก
MMDETECTION: กล่องเครื่องมือตรวจจับ OpenMMLAB และเกณฑ์มาตรฐาน
MMDETECTION3D: แพลตฟอร์มรุ่นต่อไปของ OpenMMLAB สำหรับการตรวจจับวัตถุ 3D ทั่วไป
MMrotate: กล่องเครื่องมือตรวจจับวัตถุที่หมุนของ OpenMMLAB และเบนช์มาร์ก
MMSegentation: OpenMMLAB Semantic Sementation Toolbox และ Benchmark
MMOCH: การตรวจจับข้อความ OpenMMLAB การรับรู้และการทำความเข้าใจกล่องเครื่องมือ
MMPOSE: OpenMMLAB POSE POSE TOOLBOX และ BENGAGM
MMHUMAN3D: OpenMMLAB 3D Human Parametric Model Toolbox และ Benchmark
MMSelfSup: OpenMMLAB กล่องเครื่องมือการเรียนรู้ที่ดูแลตนเองและเกณฑ์มาตรฐาน
MMRAZOR: กล่องเครื่องมือการบีบอัดแบบจำลอง OpenMMLAB และเกณฑ์มาตรฐาน
MMFEWSHOT: OpenMMLAB ไม่กี่กล่องเครื่องมือการเรียนรู้และเกณฑ์มาตรฐาน
MMACTION2: กล่องเครื่องมือและเกณฑ์มาตรฐานของ OpenMMLAB
MMTRACKING: กล่องเครื่องมือการรับรู้วิดีโอ OpenMMLAB และเกณฑ์มาตรฐาน
MMFLOW: OpenMMLAB OPTICAL FLOW TOOLBOX และ BENGAGM
MMediting: OpenMMLAB Image และ Video Editing Toolbox
MMGeneration: OpenMMLAB IMAGE และ VIDEA Generative Models กล่องเครื่องมือ
MMDeploy: OpenMMLAB MODEL FRAMEWORK FRAMEWORK

ยินดีต้อนรับสู่ชุมชน OpenMMLAB

สแกนรหัส QR ด้านล่างเพื่อติดตาม บัญชีทางการ ของทีม OpenMMLAB และเข้าร่วม กลุ่ม QQ ของทีม OpenMMLAB หรือเข้าร่วมการสื่อสารอย่างเป็นทางการ WeChat Group โดยการเพิ่ม WeChat หรือเข้าร่วม Slack ของเรา

เราจะจัดหาชุมชน OpenMMLAB ให้คุณ

- แบ่งปันเทคโนโลยีหลักล่าสุดของเฟรมเวิร์ก AI
การอธิบายซอร์สโค้ดโมดูลทั่วไปของ Pytorch
- ข่าวที่เกี่ยวข้องกับการเปิดตัว OpenMMLAB
บทนำของอัลกอริทึมที่ทันสมัยที่พัฒนาโดย OpenMMLAB? รับคำตอบและข้อเสนอแนะที่มีประสิทธิภาพมากขึ้น
เป็นแพลตฟอร์มสำหรับการสื่อสารกับนักพัฒนาจากทุกสาขาอาชีพ

ชุมชน OpenMMLAB ตั้งตารอการเข้าร่วมของคุณ! -

ขยาย

ข้อมูลเพิ่มเติม