文档|安装| ?模型动物园| ?更新新闻|报告问题
英语| 简体中文











默认分支现在是main ,分支上的代码已升级到v1.0.0。现在,在0.x分支上存在旧的main分支(v0.6.3)代码。如果您一直在使用main分支并遇到升级问题,请阅读有关分支机构的迁移指南和注释。
V1.0.0于2023-04-06发布。 1.0.0rc6的重大更新包括:
要了解有关MMOCR 1.0中更新的更多信息,请参阅MMOCR 1.X中的新功能,或者阅读ChangElog以获取更多详细信息!
MMOCR是基于Pytorch和MMDetection的开源工具箱,用于文本检测,文本识别以及包括关键信息提取的相应下游任务。它是OpenMMLAB项目的一部分。
主要分支与Pytorch 1.6+一起使用。

综合管道
该工具箱不仅支持文本检测和文本识别,还支持其下游任务,例如关键信息提取。
多个模型
该工具箱支持各种最先进的模型,用于文本检测,文本识别和关键信息提取。
模块化设计
MMOCR的模块化设计使用户能够定义自己的优化器,数据预处理器以及型号组件,例如骨架,颈部和头部以及损失。请参阅概述如何构建自定义模型。
许多公用事业
该工具箱提供了一组全面的实用程序,可以帮助用户评估模型的性能。它包括可视化器,可视化图像,地面真相以及预测的边界框以及用于评估训练期间检查点的验证工具。它还包括数据转换器,以演示如何将自己的数据转换为工具箱支持的注释文件。
MMOCR取决于Pytorch,Mmengine,MMCV和MMDetection。以下是安装的快速步骤。请参阅安装指南以获取更多详细说明。
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . 请参阅快速运行,以获取MMOCR的基本用法。
支持的算法:
有关更多详细信息,请参考Model_zoo。
以下是基于MMOCR建立的SOTA模型和解决方案的一些实现,这些模型和解决方案得到了社区用户的支持和维护。这些项目展示了基于MMOCR的研究和产品开发的最佳实践。我们欢迎并感谢OpenMMLAB生态系统的所有贡献。
我们感谢为改善MMOCR的所有贡献。请参阅贡献指南的贡献。
MMOCR是一个开源项目,由来自各种大学和公司的研究人员和工程师贡献。我们感谢所有实施方法或添加新功能的贡献者以及提供宝贵反馈的用户。我们希望工具箱和基准可以通过提供灵活的工具包来重新实现现有方法并开发自己的新OCR方法来为不断增长的研究社区提供服务。
如果您发现此项目对您的研究有用,请考虑引用:
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}该项目以Apache 2.0许可发布。
扫描下面的QR码以遵循OpenMMLAB团队的Zhihu官方帐户,并加入OpenMMLAB团队的QQ组,或加入官方的通信微信小组,或加入我们的Slack Slack
我们将为您提供OpenMMLAB社区
OpenMMLAB社区期待您的参与! ?