mmocr下载 - mmocr源代码下载

mmocr

Python

v1.0.1

下载

文档|安装| ？模型动物园| ？更新新闻|报告问题

英语| 简体中文

介绍

MMOCR是基于Pytorch和MMDetection的开源工具箱，用于文本检测，文本识别以及包括关键信息提取的相应下游任务。它是OpenMMLAB项目的一部分。

主要分支与Pytorch 1.6+一起使用。

主要功能

综合管道
该工具箱不仅支持文本检测和文本识别，还支持其下游任务，例如关键信息提取。
多个模型
该工具箱支持各种最先进的模型，用于文本检测，文本识别和关键信息提取。
模块化设计
MMOCR的模块化设计使用户能够定义自己的优化器，数据预处理器以及型号组件，例如骨架，颈部和头部以及损失。请参阅概述如何构建自定义模型。
许多公用事业
该工具箱提供了一组全面的实用程序，可以帮助用户评估模型的性能。它包括可视化器，可视化图像，地面真相以及预测的边界框以及用于评估训练期间检查点的验证工具。它还包括数据转换器，以演示如何将自己的数据转换为工具箱支持的注释文件。

安装

MMOCR取决于Pytorch，Mmengine，MMCV和MMDetection。以下是安装的快速步骤。请参阅安装指南以获取更多详细说明。

conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e .

开始

请参阅快速运行，以获取MMOCR的基本用法。

模型动物园

支持的算法：

骨干

OCLIP（ECCV'2022）

文本检测

文本识别

关键信息提取

SDMG-R（Arxiv'2021）

文字发现

ABCNET（CVPR'2020）
ABCNETV2（TPAMI'2021）
SPTS（ACM MM'2022）

有关更多详细信息，请参考Model_zoo。

项目

以下是基于MMOCR建立的SOTA模型和解决方案的一些实现，这些模型和解决方案得到了社区用户的支持和维护。这些项目展示了基于MMOCR的研究和产品开发的最佳实践。我们欢迎并感谢OpenMMLAB生态系统的所有贡献。

贡献

我们感谢为改善MMOCR的所有贡献。请参阅贡献指南的贡献。

致谢

MMOCR是一个开源项目，由来自各种大学和公司的研究人员和工程师贡献。我们感谢所有实施方法或添加新功能的贡献者以及提供宝贵反馈的用户。我们希望工具箱和基准可以通过提供灵活的工具包来重新实现现有方法并开发自己的新OCR方法来为不断增长的研究社区提供服务。

引用

如果您发现此项目对您的研究有用，请考虑引用：

 @article { mmocr2022 ,
    title = { MMOCR:  A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
    author = { MMOCR Developer Team } ,
    howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
    year = { 2022 }
}