tensorflow_PSENet
1.0.0
这是PSENET的张量重新实现:与渐进式扩展网络的形状可靠文本检测。
感谢作者的(@whai362)很棒的工作!
在2015年ICDAR培训(培训集) + ICDAR2017 MLT(培训集):
Baiduyun提取代码:PFFD
Google Drive
该模型不如文章那样好,而只是参考。您可以对其进行填补,也可以根据此代码进行大量优化。
| 数据库 | 精确 (%) | 记起 (%) | f-measure(%) |
|---|---|---|---|
| ICDAR 2015(Val) | 74.61 | 80.93 | 77.64 |
如果要训练模型,则应在数据集路径中提供数据集路径,每个图像应为每个图像提供单独的GT文本文件,并确保GT文本和图像文件具有相同的名称。
然后运行train.py喜欢:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
如果您有一个以上的GPU,则可以将GPU ID传递给GPU_LIST(例如-gpu_list = 0,1,2,3)
笔记:
运行eval.py喜欢:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
然后将文本文件和结果图像写入输出路径。






如果您首先遇到任何问题检查问题,也可以打开新问题。
@rkshuai在model.py中找到了有关Concat功能的错误。
如果此存储库对您有所帮助,请出演。谢谢。