Documentación | Instalación | ? Zoológico modelo | ? ACTUALIZACIÓN Noticias | ? Problemas de informes
Inglés | 简体中文











La rama predeterminada ahora es main y el código en la rama se ha actualizado a V1.0.0. El antiguo código de la rama main (V0.6.3) ahora existe en la rama 0.x Si ha estado utilizando los problemas de actualización de la rama main y el encuentro, lea la guía de migración y las notas sobre las ramas.
V1.0.0 se lanzó en 2023-04-06. Las actualizaciones importantes de 1.0.0rc6 incluyen:
Para saber más sobre las actualizaciones en MMOCR 1.0, consulte lo nuevo en MMOCR 1.x, ¡o lea ChangeLog para más detalles!
MMOCR es una caja de herramientas de código abierto basada en Pytorch y MMDetection para la detección de texto, el reconocimiento de texto y las tareas posteriores correspondientes, incluida la extracción de información clave. Es parte del proyecto OpenMMLab.
La rama principal funciona con Pytorch 1.6+ .

Tubería integral
La caja de herramientas admite no solo la detección de texto y el reconocimiento de texto, sino también sus tareas aguas abajo, como la extracción de información clave.
Múltiples modelos
La caja de herramientas admite una amplia variedad de modelos de vanguardia para detección de texto, reconocimiento de texto y extracción de información clave.
Diseño modular
El diseño modular de MMOCR permite a los usuarios definir sus propios optimizadores, preprocesadores de datos y componentes modelo, como trasteros, cuellos y cabezas, así como pérdidas. Consulte la descripción general sobre cómo construir un modelo personalizado.
Numerosas utilidades
La caja de herramientas proporciona un conjunto completo de utilidades que puede ayudar a los usuarios a evaluar el rendimiento de los modelos. Incluye visualizadores que permiten la visualización de imágenes, verdades terrestres, así como cajas limitadas predichas, y una herramienta de validación para evaluar los puntos de control durante el entrenamiento. También incluye convertidores de datos para demostrar cómo convertir sus propios datos en los archivos de anotación que admite la caja de herramientas.
MMOCR depende de Pytorch, MMEngine, MMCV y MMDetection. A continuación hay pasos rápidos para la instalación. Consulte la Guía de instalación para obtener una instrucción más detallada.
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . Consulte rápido Run para el uso básico de MMOCR.
Algoritmos compatibles:
Consulte Model_zoo para obtener más detalles.
Aquí hay algunas implementaciones de modelos y soluciones SOTA basadas en MMOCR, que son compatibles y mantenidas por los usuarios de la comunidad. Estos proyectos demuestran las mejores prácticas basadas en MMOCR para la investigación y el desarrollo de productos. Agradecemos y apreciamos todas las contribuciones al ecosistema OpenMMLab.
Apreciamos todas las contribuciones para mejorar MMOCR. Consulte Contriping.MD para las pautas contribuyentes.
MMOCR es un proyecto de código abierto que contribuyen con investigadores e ingenieros de varias universidades y empresas. Apreciamos a todos los contribuyentes que implementan sus métodos o agregan nuevas características, así como a los usuarios que otorgan comentarios valiosos. Esperamos que la caja de herramientas y el punto de referencia puedan servir a la creciente comunidad de investigación al proporcionar un conjunto de herramientas flexible para reimplinar los métodos existentes y desarrollar sus propios nuevos métodos OCR.
Si encuentra útil este proyecto en su investigación, considere citar:
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}Este proyecto se publica bajo la licencia Apache 2.0.
Escanee el código QR a continuación para seguir la cuenta oficial de Zhihu del equipo de OpenMMLAB y únase al grupo QQ del equipo de OpenMMLab, o unirse al grupo oficial de comunicación WeChat agregando el WeChat, o unirse a nuestro Slack.
Le proporcionaremos la comunidad OpenMMLab
¡La comunidad OpenMMLab espera su participación! ?