tensorflow_PSENet
1.0.0
這是PSENET的張量重新實現:與漸進式擴展網絡的形狀可靠文本檢測。
感謝作者的(@whai362)很棒的工作!
在2015年ICDAR培訓(培訓集) + ICDAR2017 MLT(培訓集):
Baiduyun提取代碼:PFFD
Google Drive
該模型不如文章那樣好,而只是參考。您可以對其進行填補,也可以根據此代碼進行大量優化。
| 資料庫 | 精確 (%) | 記起 (%) | f-measure(%) |
|---|---|---|---|
| ICDAR 2015(Val) | 74.61 | 80.93 | 77.64 |
如果要訓練模型,則應在數據集路徑中提供數據集路徑,每個圖像應為每個圖像提供單獨的GT文本文件,並確保GT文本和圖像文件具有相同的名稱。
然後運行train.py喜歡:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
如果您有一個以上的GPU,則可以將GPU ID傳遞給GPU_LIST(例如-gpu_list = 0,1,2,3)
筆記:
運行eval.py喜歡:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
然後將文本文件和結果圖像寫入輸出路徑。






如果您首先遇到任何問題檢查問題,也可以打開新問題。
@rkshuai在model.py中找到了有關Concat功能的錯誤。
如果此存儲庫對您有所幫助,請出演。謝謝。