Dokumentasi | Instalasi | ? Model Zoo | ? Perbarui berita | Masalah pelaporan
Bahasa Inggris | 简体中文











Cabang default sekarang main dan kode di cabang telah ditingkatkan ke v1.0.0. Kode cabang main (v0.6.3) sekarang ada di cabang 0.x Jika Anda telah menggunakan Cabang main dan menemui masalah peningkatan, silakan baca panduan migrasi dan catatan di cabang.
V1.0.0 dirilis pada 2023-04-06. Pembaruan besar dari 1.0.0RC6 meliputi:
Untuk mengetahui lebih lanjut tentang pembaruan di MMOCR 1.0, silakan merujuk pada apa yang baru di MMOCR 1.x, atau membaca Changelog untuk lebih jelasnya!
MMOCR adalah kotak alat open-source berdasarkan pytorch dan mmdetection untuk deteksi teks, pengenalan teks, dan tugas hilir yang sesuai termasuk ekstraksi informasi utama. Ini adalah bagian dari proyek OpenMmLab.
Cabang utama bekerja dengan Pytorch 1.6+ .

Pipa yang komprehensif
Toolbox tidak hanya mendukung deteksi teks dan pengenalan teks, tetapi juga tugas hilirnya seperti ekstraksi informasi utama.
Beberapa model
Toolbox mendukung berbagai model canggih untuk deteksi teks, pengenalan teks dan ekstraksi informasi utama.
Desain Modular
Desain modular MMOCR memungkinkan pengguna untuk mendefinisikan pengoptimal mereka sendiri, preprosesor data, dan komponen model seperti tulang punggung, leher dan kepala serta kerugian. Silakan merujuk ke ikhtisar untuk membuat model yang disesuaikan.
Banyak utilitas
Toolbox ini menyediakan serangkaian utilitas yang komprehensif yang dapat membantu pengguna menilai kinerja model. Ini termasuk visualisasi yang memungkinkan visualisasi gambar, kebenaran tanah serta kotak pembatas yang diprediksi, dan alat validasi untuk mengevaluasi pos pemeriksaan selama pelatihan. Ini juga termasuk konverter data untuk menunjukkan cara mengonversi data Anda sendiri ke file anotasi yang didukung oleh kotak alat.
MMOCR tergantung pada pytorch, mmengine, mmcv dan mmdetection. Di bawah ini adalah langkah cepat untuk instalasi. Silakan merujuk ke Panduan Instal untuk instruksi yang lebih rinci.
conda create -n open-mmlab python=3.8 pytorch=1.10 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate open-mmlab
pip3 install openmim
git clone https://github.com/open-mmlab/mmocr.git
cd mmocr
mim install -e . Silakan lihat lari cepat untuk penggunaan dasar MMOCR.
Algoritma yang Didukung:
Silakan merujuk ke model_zoo untuk detail lebih lanjut.
Berikut adalah beberapa implementasi model dan solusi SOTA yang dibangun di atas MMOCR, yang didukung dan dikelola oleh pengguna masyarakat. Proyek -proyek ini menunjukkan praktik terbaik berdasarkan MMOCR untuk penelitian dan pengembangan produk. Kami menyambut dan menghargai semua kontribusi untuk ekosistem OpenMMLab.
Kami menghargai semua kontribusi untuk meningkatkan MMOCR. Silakan merujuk ke Contributing.MD untuk Pedoman yang Berkontribusi.
MMOCR adalah proyek open-source yang disumbangkan oleh para peneliti dan insinyur dari berbagai perguruan tinggi dan perusahaan. Kami menghargai semua kontributor yang mengimplementasikan metode mereka atau menambahkan fitur baru, serta pengguna yang memberikan umpan balik yang berharga. Kami berharap kotak alat dan tolok ukur dapat melayani komunitas penelitian yang berkembang dengan menyediakan toolkit yang fleksibel untuk menerapkan kembali metode yang ada dan mengembangkan metode OCR baru mereka sendiri.
Jika Anda menemukan proyek ini berguna dalam penelitian Anda, silakan pertimbangkan CITE:
@article { mmocr2022 ,
title = { MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding } ,
author = { MMOCR Developer Team } ,
howpublished = { url{https://github.com/open-mmlab/mmocr} } ,
year = { 2022 }
}Proyek ini dirilis di bawah lisensi Apache 2.0.
Pindai kode QR di bawah ini untuk mengikuti akun resmi Zhihu tim OpenMMLAB dan bergabung dengan grup QQ tim OpenMmLab, atau bergabung dengan grup WeChat komunikasi resmi dengan menambahkan WeChat, atau bergabung dengan Slack kami
Kami akan memberi Anda komunitas OpenMmLab
Komunitas OpenMmLab menantikan partisipasi Anda! ?