Ini adalah implementasi ulang TensorFlow dari PSENET: Deteksi teks yang kuat bentuk dengan jaringan ekspansi skala progresif.
Terima kasih untuk karya penulis (@whai362) yang luar biasa!
Dilatih di ICDAR 2015 (set pelatihan) + ICDAR2017 MLT (set pelatihan):
Kode Ekstrak Baiduyun: PFFD
Google Drive
Model ini tidak sebagus artikel, itu hanya referensi. Anda dapat finetune di atasnya atau Anda dapat melakukan banyak optimasi berdasarkan kode ini.
| Database | Presisi (%) | Mengingat (%) | F-Measure (%) |
|---|---|---|---|
| ICDAR 2015 (VAL) | 74.61 | 80.93 | 77.64 |
Jika Anda ingin melatih model, Anda harus menyediakan jalur dataset, di jalur dataset, file teks GT terpisah harus disediakan untuk setiap gambar, dan pastikan bahwa teks dan file gambar GT memiliki nama yang sama .
Kemudian jalankan train.py like:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
Jika Anda memiliki lebih dari satu GPU, Anda dapat meneruskan ID GPU ke GPU_List (seperti --gpu_list = 0,1,2,3)
Catatan:
Jalankan eval.py like:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
File teks dan gambar hasil akan ditulis ke jalur output.






Jika Anda menghadapi masalah pemeriksaan masalah terlebih dahulu, atau Anda dapat membuka masalah baru.
@rkshuai menemukan bug tentang fitur concat di model.py.
Jika repositori ini membantu Anda, silakan bintangi. Terima kasih.