tensorflow_PSENet
1.0.0
これは、Psenet:Progressive Scale Expansion Networkを使用した形状の堅牢なテキスト検出のTensorflowの再実装です。
著者の(@whai362)素晴らしい仕事をありがとう!
ICDAR 2015(トレーニングセット) + ICDAR2017 MLT(トレーニングセット)でトレーニング:
Baiduyun Extractコード:PFFD
Googleドライブ
このモデルは記事ほど良くありません。単なる参照です。あなたはそれで微調整することができます、またはあなたはこのコードに基づいて多くの最適化を行うことができます。
| データベース | 精度(%) | 想起 (%) | f-Measure(%) |
|---|---|---|---|
| ICDAR 2015(VAL) | 74.61 | 80.93 | 77.64 |
モデルをトレーニングする場合は、データセットパスを提供する必要があります。データセットパスでは、各画像に個別のGTテキストファイルを提供し、 GTテキストと画像ファイルに同じ名前があることを確認する必要があります。
その後、train.pyのように走ります:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
複数のGPUがある場合は、GPU IDをGPU_LISTに渡すことができます(-GPU_LIST = 0,1,2,3)
注記:
eval.pyのように実行:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
テキストファイルと結果画像が出力パスに書き込まれます。






問題が発生した場合、最初に問題を確認するか、新しい問題を開くことができます。
@rkshuaiは、model.pyでconcat機能に関するバグを見つけました。
このリポジトリが役立つ場合は、主演してください。ありがとう。