Téléchargement mmocr - Téléchargement du code source mmocr

mmocr

Python

v1.0.1

Télécharger

Documentation | Installation | ? Modèle Zoo | ? Mettre à jour les nouvelles | ? Reporter des problèmes

Anglais | 简体中文

Dernières mises à jour

La branche par défaut est désormais main et le code de la branche a été mis à niveau vers V1.0.0. L'ancienne branche main (V0.6.3) existe désormais sur la branche 0.x Si vous avez utilisé les problèmes de mise à niveau de la branche et de la rencontre main , veuillez lire le guide de migration et les notes sur les branches.

V1.0.0 a été publié en 2023-04-06. Les mises à jour majeures de 1.0.0rc6 incluent:

Prise en charge des ensembles de données SCUT-CTW1500, SynthText et MJSYNTH dans le préparateur de jeu de données
FAQ et documentation mis à jour
Dépréciation de file_client_args en faveur de backend_args
Ajout d'un nouveau cahier de tutoriel MMOCr

Pour en savoir plus sur les mises à jour dans MMOCR 1.0, veuillez vous référer à ce qui est nouveau dans MMOCR 1.x, ou lire Changelog pour plus de détails!

Introduction

MMOCR est une boîte à outils open source basée sur Pytorch et MMDection pour la détection de texte, la reconnaissance de texte et les tâches en aval correspondantes, y compris l'extraction d'informations clés. Il fait partie du projet OpenMMLAB.

La branche principale fonctionne avec Pytorch 1.6+ .

Caractéristiques majeures

Pipeline complet
La boîte à outils prend en charge non seulement la détection de texte et la reconnaissance de texte, mais aussi leurs tâches en aval telles que l'extraction des informations clés.
Modèles multiples
La boîte à outils prend en charge une grande variété de modèles de pointe pour la détection de texte, la reconnaissance de texte et l'extraction des informations clés.
Conception modulaire
La conception modulaire de MMOCR permet aux utilisateurs de définir leurs propres optimiseurs, préprocesseurs de données et composants modèles tels que les squelette, les cous et les têtes ainsi que les pertes. Veuillez vous référer à un aperçu de la façon de construire un modèle personnalisé.
De nombreux services publics
La boîte à outils fournit un ensemble complet d'utilitaires qui peuvent aider les utilisateurs à évaluer les performances des modèles. Il comprend des visualiseurs qui permettent la visualisation des images, des vérités au sol ainsi que des boîtes de délimitation prédites et un outil de validation pour évaluer les points de contrôle pendant la formation. Il comprend également des convertisseurs de données pour montrer comment convertir vos propres données en fichiers d'annotation que la boîte à outils prend en charge.

Installation

Le MMOCC dépend de Pytorch, Mmengine, MMCV et MMDETECTION. Vous trouverez ci-dessous des étapes rapides pour l'installation. Veuillez vous référer au guide d'installation pour une instruction plus détaillée.

conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e .

Commencer

Veuillez consulter Quick Run pour l'utilisation de base de MMOCR.

Zoo modèle

Algorithmes pris en charge:

Colonne vertébrale

OCLIP (ECCV'2022)

Détection de texte

Reconnaissance de texte

Extraction d'informations clés

SDMG-R (ARXIV'2021)

Repérage de texte

ABCNET (CVPR'2020)
ABCNETV2 (TPAMI'2021)
SPTS (ACM MM'2022)

Veuillez vous référer à Model_Zoo pour plus de détails.

Projets

Voici quelques implémentations de modèles et de solutions SOTA construits sur MMOCR, qui sont pris en charge et entretenus par les utilisateurs de la communauté. Ces projets démontrent les meilleures pratiques basées sur le MMOCR pour la recherche et le développement de produits. Nous accueillons et apprécions toutes les contributions à l'écosystème OpenMMLAB.

Contributif

Nous apprécions toutes les contributions pour améliorer MMOCR. Veuillez vous référer à contribution.md pour les directives contributives.

Reconnaissance

MMOCR est un projet open source qui est apporté par des chercheurs et des ingénieurs de divers collèges et entreprises. Nous apprécions tous les contributeurs qui mettent en œuvre leurs méthodes ou ajoutent de nouvelles fonctionnalités, ainsi que des utilisateurs qui donnent des commentaires précieux. Nous espérons que la boîte à outils et la référence pourraient servir la communauté de recherche croissante en fournissant une boîte à outils flexible pour réimplémenter les méthodes existantes et développer leurs propres nouvelles méthodes OCR.

Citation

Si vous trouvez ce projet utile dans vos recherches, veuillez envisager citer:

 @article { mmocr2022 ,
    title = { MMOCR:  A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
    author = { MMOCR Developer Team } ,
    howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
    year = { 2022 }
}

Licence

Ce projet est publié sous la licence Apache 2.0.

Famille OpenMmLab

MMENGINE: Bibliothèque fondamentale OpenMMLab pour la formation des modèles d'apprentissage en profondeur
MMCV: Bibliothèque fondamentale OpenMMLab pour la vision par ordinateur.
MIM: MIM installe les packages OpenMmLab.
MMCLASSIFICATION: boîte à outils de classification d'image OpenMMLAB et benchmark.
MMDETECTION: Boîte à outils de détection OpenMMLAB et benchmark.
MMDETECTION3D: Plateforme de nouvelle génération d'OpenMMLab pour la détection d'objets General 3D.
MMROTATE: Boîte à outils de détection d'objets rotative OpenMMLab et benchmark.
MmSegmentation: boîte à outils de segmentation sémantique OpenMMLAB et référence.
MMOCR: OpenMmLab Text Detection, Reconnaissance et compréhension de la boîte à outils.
MMPOSE: OpenMMLab Pose Estimation Toolbox et Benchmark.
MMHUMAN3D: OpenMMLab 3D Human Parametric Model Box and Benchmark.
MMelSup: OpenMmlab Auto-supervisé d'apprentissage et référence.
MMRAZOR: boîte à outils de compression du modèle OpenMMLAB et benchmark.
MMFewshot: OpenMmLab FewShot Learning Toolbox et Benchmark.
MMAction2: OpenMMLab Next Genération Action Comprendre la boîte à outils et la référence.
MMTRACKING: OpenMMLab Video Perception Toolbox and Benchmark.
MMFLOW: boîte à outils à débit optique OpenMMLAB et benchmark.
Mmediting: OpenMMLab Image et Toolbox de montage vidéo.
MMGENERATION: OpenMMLAB Image et vidéo Modèles génératifs Boîtes à outils.
MMDEPLOY: Framework de déploiement du modèle OpenMMLAB.

Bienvenue dans la communauté OpenMMMLAB

Scannez le code QR ci-dessous pour suivre le compte officiel ZHUHU de l'équipe OpenMMLAB et rejoignez le groupe QQ de l'équipe OpenMMLAB, ou rejoignez le groupe de communication officiel de communication en ajoutant le WeChat ou rejoignez notre Slack

Nous vous fournirons la communauté OpenMMLAB

? Partagez les dernières technologies de base des cadres d'IA
Expliquer le code source du module commun Pytorch
? Nouvelles liées à la sortie d'OpenMmLab
Introduction d'algorithmes de pointe développés par OpenMMLab? Obtenez la réponse et les commentaires plus efficaces
Fournir une plate-forme de communication avec les développeurs de tous horizons

La communauté OpenMMLAB attend avec impatience votre participation! ?

Développer

Informations supplémentaires