Esta é uma reimplementação de tensorflow da PSENET: Shapet Robust Text Detecção com rede de expansão de escala progressiva.
Obrigado pelo trabalho incrível do autor (@whai362)!
Treinado no iCDAR 2015 (conjunto de treinamento) + ICDAR2017 MLT (conjunto de treinamento):
Código de extrato de Baiduyun: pffd
Google Drive
Este modelo não é tão bom quanto o artigo, é apenas uma referência. Você pode finalizar ou fazer muita otimização com base nesse código.
| Banco de dados | Precisão (%) | Lembrar (%) | F-Medice (%) |
|---|---|---|---|
| ICDAR 2015 (VAL) | 74.61 | 80,93 | 77.64 |
Se você deseja treinar o modelo, deve fornecer o caminho do conjunto de dados, no caminho do conjunto de dados, um arquivo de texto GT separado deve ser fornecido para cada imagem e verifique se o texto GT e o arquivo de imagem têm os mesmos nomes .
Em seguida, execute o trem.py como:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
Se você tem mais de uma GPU, pode passar os IDs da GPU para GPU_LIST (como - -gpu_list = 0,1,2,3)
Observação:
Run Eval.py Like:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
Um arquivo de texto e uma imagem de resultado serão gravados no caminho de saída.






Se você encontrar algum problema de verificação de problemas primeiro ou poderá abrir um novo problema.
@rkshuai encontrou um bug sobre os recursos concats no modelo.py.
Se este repositório ajudar você a estrela. Obrigado.