ドキュメント|インストール| ?モデル動物園| ?ニュースを更新| ?報告の問題
英語| 简体中文











デフォルトのブランチがmainなり、ブランチ上のコードがv1.0.0にアップグレードされました。古いmainブランチ(v0.6.3)コードは、 0.xブランチに存在するようになりました。 mainブランチを使用していて、アップグレードの問題が発生している場合は、ブランチに関する移行ガイドとメモをお読みください。
V1.0.0は2023-04-06にリリースされました。 1.0.0RC6からの主要な更新には、以下が含まれます。
MMOCR 1.0の更新の詳細については、MMOCR 1.xの新機能を参照するか、詳細についてはChangelogをお読みください。
MMOCRは、テキスト検出、テキスト認識、および主要な情報抽出を含む対応するダウンストリームタスクのためのPytorchとMMDeTectionに基づくオープンソースツールボックスです。 OpenMMLabプロジェクトの一部です。
メインブランチは、Pytorch 1.6+で動作します。

包括的なパイプライン
ツールボックスは、テキストの検出とテキスト認識だけでなく、主要な情報抽出などの下流のタスクもサポートしています。
複数のモデル
このツールボックスは、テキスト検出、テキスト認識、主要な情報抽出のためのさまざまな最先端のモデルをサポートしています。
モジュラー設計
MMOCRのモジュラー設計により、ユーザーは、バックボーン、首、ヘッドなどの独自のオプティマイザー、データプレセッサー、およびモデルコンポーネントを定義できます。カスタマイズされたモデルの構築方法については、概要を参照してください。
多数のユーティリティ
ツールボックスは、ユーザーがモデルのパフォーマンスを評価するのに役立つ包括的なユーティリティセットを提供します。これには、画像の視覚化、グラウンドトゥルース、予測される境界ボックス、およびトレーニング中にチェックポイントを評価するための検証ツールを可能にする視覚化装置が含まれます。また、データコンバーターが含まれており、ツールボックスがサポートするアノテーションファイルに独自のデータを変換する方法を示します。
MMOCRは、Pytorch、Mmengine、MMCV、MMDeTectionに依存します。以下は、インストール用の簡単な手順です。より詳細な指示については、インストールガイドを参照してください。
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . MMOCRの基本的な使用については、Quick Runをご覧ください。
サポートされているアルゴリズム:
詳細については、model_zooを参照してください。
MMOCRに基づいて構築されたSOTAモデルとソリューションのいくつかの実装を以下に示します。これらは、コミュニティユーザーによってサポートおよび維持されています。これらのプロジェクトは、研究と製品開発のためのMMOCRに基づいたベストプラクティスを示しています。 OpenMMLabエコシステムへのすべての貢献を歓迎し、感謝しています。
MMOCRを改善するためのすべての貢献に感謝します。貢献ガイドラインについては、converting.mdを参照してください。
MMOCRは、さまざまな大学や企業の研究者やエンジニアによって提供されるオープンソースプロジェクトです。メソッドを実装したり、新機能を追加したりするすべての貢献者と、貴重なフィードバックを提供するユーザーに感謝します。ツールボックスとベンチマークが、既存の方法を再実装するための柔軟なツールキットを提供し、独自の新しいOCRメソッドを開発することにより、成長する研究コミュニティに役立つことを願っています。
このプロジェクトがあなたの研究で役立つと思う場合は、引用を検討してください。
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}このプロジェクトは、Apache 2.0ライセンスの下でリリースされます。
以下のQRコードをスキャンして、OpenMMLabチームのZhihu公式アカウントに従い、OpenMMLabチームのQQグループに参加するか、WeChatを追加して公式のコミュニケーションWechatグループに参加するか、 Slackに参加してください
OpenMMLabコミュニティを提供します
OpenMMLabコミュニティは、あなたの参加を楽しみにしています! ?