文檔|安裝| ?模型動物園| ?更新新聞|報告問題
英語| 簡體中文











默認分支現在是main ,分支上的代碼已升級到v1.0.0。現在,在0.x分支上存在舊的main分支(v0.6.3)代碼。如果您一直在使用main分支並遇到升級問題,請閱讀有關分支機構的遷移指南和註釋。
V1.0.0於2023-04-06發布。 1.0.0rc6的重大更新包括:
要了解有關MMOCR 1.0中更新的更多信息,請參閱MMOCR 1.X中的新功能,或者閱讀ChangElog以獲取更多詳細信息!
MMOCR是基於Pytorch和MMDetection的開源工具箱,用於文本檢測,文本識別以及包括關鍵信息提取的相應下游任務。它是OpenMMLAB項目的一部分。
主要分支與Pytorch 1.6+一起使用。

綜合管道
該工具箱不僅支持文本檢測和文本識別,還支持其下游任務,例如關鍵信息提取。
多個模型
該工具箱支持各種最先進的模型,用於文本檢測,文本識別和關鍵信息提取。
模塊化設計
MMOCR的模塊化設計使用戶能夠定義自己的優化器,數據預處理器以及型號組件,例如骨架,頸部和頭部以及損失。請參閱概述如何構建自定義模型。
許多公用事業
該工具箱提供了一組全面的實用程序,可以幫助用戶評估模型的性能。它包括可視化器,可視化圖像,地面真相以及預測的邊界框以及用於評估訓練期間檢查點的驗證工具。它還包括數據轉換器,以演示如何將自己的數據轉換為工具箱支持的註釋文件。
MMOCR取決於Pytorch,Mmengine,MMCV和MMDetection。以下是安裝的快速步驟。請參閱安裝指南以獲取更多詳細說明。
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . 請參閱快速運行,以獲取MMOCR的基本用法。
支持的算法:
有關更多詳細信息,請參考Model_zoo。
以下是基於MMOCR建立的SOTA模型和解決方案的一些實現,這些模型和解決方案得到了社區用戶的支持和維護。這些項目展示了基於MMOCR的研究和產品開發的最佳實踐。我們歡迎並感謝OpenMMLAB生態系統的所有貢獻。
我們感謝為改善MMOCR的所有貢獻。請參閱貢獻指南的貢獻。
MMOCR是一個開源項目,由來自各種大學和公司的研究人員和工程師貢獻。我們感謝所有實施方法或添加新功能的貢獻者以及提供寶貴反饋的用戶。我們希望工具箱和基準可以通過提供靈活的工具包來重新實現現有方法並開發自己的新OCR方法來為不斷增長的研究社區提供服務。
如果您發現此項目對您的研究有用,請考慮引用:
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}該項目以Apache 2.0許可發布。
掃描下面的QR碼以遵循OpenMMLAB團隊的Zhihu官方帳戶,並加入OpenMMLAB團隊的QQ組,或加入官方的通信微信小組,或加入我們的Slack Slack
我們將為您提供OpenMMLAB社區
OpenMMLAB社區期待您的參與! ?