Documentation | Installation | ? Modèle Zoo | ? Mettre à jour les nouvelles | ? Reporter des problèmes
Anglais | 简体中文











La branche par défaut est désormais main et le code de la branche a été mis à niveau vers V1.0.0. L'ancienne branche main (V0.6.3) existe désormais sur la branche 0.x Si vous avez utilisé les problèmes de mise à niveau de la branche et de la rencontre main , veuillez lire le guide de migration et les notes sur les branches.
V1.0.0 a été publié en 2023-04-06. Les mises à jour majeures de 1.0.0rc6 incluent:
Pour en savoir plus sur les mises à jour dans MMOCR 1.0, veuillez vous référer à ce qui est nouveau dans MMOCR 1.x, ou lire Changelog pour plus de détails!
MMOCR est une boîte à outils open source basée sur Pytorch et MMDection pour la détection de texte, la reconnaissance de texte et les tâches en aval correspondantes, y compris l'extraction d'informations clés. Il fait partie du projet OpenMMLAB.
La branche principale fonctionne avec Pytorch 1.6+ .

Pipeline complet
La boîte à outils prend en charge non seulement la détection de texte et la reconnaissance de texte, mais aussi leurs tâches en aval telles que l'extraction des informations clés.
Modèles multiples
La boîte à outils prend en charge une grande variété de modèles de pointe pour la détection de texte, la reconnaissance de texte et l'extraction des informations clés.
Conception modulaire
La conception modulaire de MMOCR permet aux utilisateurs de définir leurs propres optimiseurs, préprocesseurs de données et composants modèles tels que les squelette, les cous et les têtes ainsi que les pertes. Veuillez vous référer à un aperçu de la façon de construire un modèle personnalisé.
De nombreux services publics
La boîte à outils fournit un ensemble complet d'utilitaires qui peuvent aider les utilisateurs à évaluer les performances des modèles. Il comprend des visualiseurs qui permettent la visualisation des images, des vérités au sol ainsi que des boîtes de délimitation prédites et un outil de validation pour évaluer les points de contrôle pendant la formation. Il comprend également des convertisseurs de données pour montrer comment convertir vos propres données en fichiers d'annotation que la boîte à outils prend en charge.
Le MMOCC dépend de Pytorch, Mmengine, MMCV et MMDETECTION. Vous trouverez ci-dessous des étapes rapides pour l'installation. Veuillez vous référer au guide d'installation pour une instruction plus détaillée.
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . Veuillez consulter Quick Run pour l'utilisation de base de MMOCR.
Algorithmes pris en charge:
Veuillez vous référer à Model_Zoo pour plus de détails.
Voici quelques implémentations de modèles et de solutions SOTA construits sur MMOCR, qui sont pris en charge et entretenus par les utilisateurs de la communauté. Ces projets démontrent les meilleures pratiques basées sur le MMOCR pour la recherche et le développement de produits. Nous accueillons et apprécions toutes les contributions à l'écosystème OpenMMLAB.
Nous apprécions toutes les contributions pour améliorer MMOCR. Veuillez vous référer à contribution.md pour les directives contributives.
MMOCR est un projet open source qui est apporté par des chercheurs et des ingénieurs de divers collèges et entreprises. Nous apprécions tous les contributeurs qui mettent en œuvre leurs méthodes ou ajoutent de nouvelles fonctionnalités, ainsi que des utilisateurs qui donnent des commentaires précieux. Nous espérons que la boîte à outils et la référence pourraient servir la communauté de recherche croissante en fournissant une boîte à outils flexible pour réimplémenter les méthodes existantes et développer leurs propres nouvelles méthodes OCR.
Si vous trouvez ce projet utile dans vos recherches, veuillez envisager citer:
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}Ce projet est publié sous la licence Apache 2.0.
Scannez le code QR ci-dessous pour suivre le compte officiel ZHUHU de l'équipe OpenMMLAB et rejoignez le groupe QQ de l'équipe OpenMMLAB, ou rejoignez le groupe de communication officiel de communication en ajoutant le WeChat ou rejoignez notre Slack
Nous vous fournirons la communauté OpenMMLAB
La communauté OpenMMLAB attend avec impatience votre participation! ?