DBNet.pytorch
1.0.0
注:一部のコードは、MHLIAO/DBから継承されます
中文解读

2020-06-07:添加灰度图训练、 dataset.args.transforms.Normalize
conda env create -f environment.yml
git clone https://github.com/WenmuZhou/DBNet.pytorch.git
cd DBNet.pytorch/
または
conda create -n dbnet python=3.6
conda activate dbnet
conda install ipython pip
# python dependencies
pip install -r requirement.txt
# install PyTorch with cuda-10.1
# Note that you can change the cudatoolkit version to the version you want.
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch
# clone repo
git clone https://github.com/WenmuZhou/DBNet.pytorch.git
cd DBNet.pytorch/
TBD
トレーニングデータ:次の形式でテキストtrain.txtを準備するには、「 t」をセパレーターとして使用します
./datasets/train/img/001.jpg ./datasets/train/gt/001.txt
検証データ:テキストtest.txt次の形式で準備し、「 t」をセパレーターとして使用します
./datasets/test/img/001.jpg ./datasets/test/gt/001.txt
imgフォルダーに画像を保存しますgtフォルダーにGroundTruthを保存しますGroundTruthは、次の形式で.txtファイルである可能性があります。
x1, y1, x2, y2, x3, y3, x4, y4, annotation
dataset['train']['dataset'['data_path']' 、 dataset['validate']['dataset'['data_path']の構成/icdar2015_resnet18_fpn_dbhead_polylr.yamlbash singlel_gpu_train.shbash multi_gpu_train.sheval.pyは、テストデータセットでモデルをテストするために使用されます
model_pathbash eval.shPredict.pyは、フォルダー内のすべての画像に推論するために使用できます
model_path 、 input_folder 、 output_folder in predict.sh bash predict.sh
predict.shファイルのmodel_pathモデルの場所に変更できます。
ヒント:結果が良くない場合は、predict.shでthre変更できます。
プロジェクトはまだ開発中です。
ICDAR2015データセットでのみトレーニングします
| 方法 | 画像サイズ(短いサイズ) | 学習率 | 精度(%) | 想起 (%) | f-Measure(%) | FPS |
|---|---|---|---|---|---|---|
| Synthtext-defrom-resnet-18(紙) | 736 | 0.007 | 86.8 | 78.4 | 82.3 | 48 |
| Imagenet-resnet18-fpn-dbhead | 736 | 1E-3 | 87.03 | 75.06 | 80.6 | 43 |
| Imagenet-defrom-resnet18-fpn-dbhead | 736 | 1E-3 | 88.61 | 73.84 | 80.56 | 36 |
| Imagenet-resnet50-fpn-dbhead | 736 | 1E-3 | 88.06 | 77.14 | 82.24 | 27 |
| imagenet-resnest50-fpn-dbhead | 736 | 1E-3 | 88.18 | 76.27 | 81.78 | 27 |
TBD
このリポジトリが役立つ場合は、主演してください。ありがとう。