mmocr下載 - mmocr源代碼下載

mmocr

Python

v1.0.1

下載

文檔|安裝| ？模型動物園| ？更新新聞|報告問題

英語| 簡體中文

介紹

MMOCR是基於Pytorch和MMDetection的開源工具箱，用於文本檢測，文本識別以及包括關鍵信息提取的相應下游任務。它是OpenMMLAB項目的一部分。

主要分支與Pytorch 1.6+一起使用。

主要功能

綜合管道
該工具箱不僅支持文本檢測和文本識別，還支持其下游任務，例如關鍵信息提取。
多個模型
該工具箱支持各種最先進的模型，用於文本檢測，文本識別和關鍵信息提取。
模塊化設計
MMOCR的模塊化設計使用戶能夠定義自己的優化器，數據預處理器以及型號組件，例如骨架，頸部和頭部以及損失。請參閱概述如何構建自定義模型。
許多公用事業
該工具箱提供了一組全面的實用程序，可以幫助用戶評估模型的性能。它包括可視化器，可視化圖像，地面真相以及預測的邊界框以及用於評估訓練期間檢查點的驗證工具。它還包括數據轉換器，以演示如何將自己的數據轉換為工具箱支持的註釋文件。

安裝

MMOCR取決於Pytorch，Mmengine，MMCV和MMDetection。以下是安裝的快速步驟。請參閱安裝指南以獲取更多詳細說明。

conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e .

開始

請參閱快速運行，以獲取MMOCR的基本用法。

模型動物園

支持的算法：

骨幹

OCLIP（ECCV'2022）

文本檢測

文本識別

關鍵信息提取

SDMG-R（Arxiv'2021）

文字發現

ABCNET（CVPR'2020）
ABCNETV2（TPAMI'2021）
SPTS（ACM MM'2022）

有關更多詳細信息，請參考Model_zoo。

專案

以下是基於MMOCR建立的SOTA模型和解決方案的一些實現，這些模型和解決方案得到了社區用戶的支持和維護。這些項目展示了基於MMOCR的研究和產品開發的最佳實踐。我們歡迎並感謝OpenMMLAB生態系統的所有貢獻。

貢獻

我們感謝為改善MMOCR的所有貢獻。請參閱貢獻指南的貢獻。

致謝

MMOCR是一個開源項目，由來自各種大學和公司的研究人員和工程師貢獻。我們感謝所有實施方法或添加新功能的貢獻者以及提供寶貴反饋的用戶。我們希望工具箱和基準可以通過提供靈活的工具包來重新實現現有方法並開發自己的新OCR方法來為不斷增長的研究社區提供服務。

引用

如果您發現此項目對您的研究有用，請考慮引用：

 @article { mmocr2022 ,
    title = { MMOCR:  A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
    author = { MMOCR Developer Team } ,
    howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
    year = { 2022 }
}