Dies ist eine Tensorflow-Neuauflagen von PSenet: Form robuster Texterkennung mit progressivem Skala-Expansionsnetzwerk.
Vielen Dank für den Autor (@WHAI362) großartige Arbeit!
Ausgebildet auf ICDAR 2015 (Trainingset) + ICDAR2017 MLT (Trainingset):
Baiduyun Extract Code: PFFD
Google Drive
Dieses Modell ist nicht so gut wie der Artikel, es ist nur eine Referenz. Sie können es beenden oder basierend auf diesem Code eine Menge Optimierung durchführen.
| Datenbank | Präzision (%) | Abrufen (%) | F-Messung (%) |
|---|---|---|---|
| ICDAR 2015 (Val) | 74,61 | 80.93 | 77,64 |
Wenn Sie das Modell trainieren möchten, sollten Sie den Datensatzpfad im Datensatzpfad angeben, eine separate GT -Textdatei sollte für jedes Bild bereitgestellt werden, und stellen Sie sicher, dass die GT -Text- und Bilddatei die gleichen Namen enthält .
Dann rennen Sie Train.py wie:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
Wenn Sie mehr als eine GPU haben, können Sie GPU -IDs an gpu_list übergeben (wie -gpu_list = 0,1,2,3)
Notiz:
run eval.py wie:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
Eine Textdatei und ein Ergebnisbild werden dann in den Ausgabepfad geschrieben.






Wenn Sie zuerst auf Probleme mit der Überprüfung von Problemen stoßen oder ein neues Problem eröffnen können.
@rkshuai fand einen Fehler zu Concat -Funktionen in model.py.
Wenn dieses Repository Ihnen hilft, sparen Sie bitte es. Danke.