tensorflow_PSENet
1.0.0
이것은 PSENET의 텐서 플로 재 구현입니다. 점진적 스케일 확장 네트워크를 사용한 Shape 강력한 텍스트 감지.
저자의 (@whai362) 멋진 작품에 감사드립니다!
ICDAR 2015 교육 (교육 세트) + ICDAR2017 MLT (교육 세트) :
Baiduyun 추출물 코드 : PFFD
구글 드라이브
이 모델은 기사만큼 좋지 않으며 참조 일뿐입니다. 이 코드를 기반으로 많은 최적화를 수행 할 수 있습니다.
| 데이터 베이스 | 정밀도 (%) | 상기하다 (%) | F- 측정 (%) |
|---|---|---|---|
| ICDAR 2015 (VAL) | 74.61 | 80.93 | 77.64 |
모델을 교육하려면 데이터 세트 경로를 제공해야합니다. 데이터 세트 경로에서 각 이미지에 별도의 GT 텍스트 파일이 제공되어야하며 GT 텍스트 및 이미지 파일에 동일한 이름이 있는지 확인해야합니다 .
그런 다음 train.py like를 실행합니다.
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
GPU 이상이 둘 이상인 경우 GPU ID를 GPU_LIST로 전달할 수 있습니다 (-GPU_LIST = 0,1,2,3).
메모:
eval.py like를 실행합니다.
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
그런 다음 텍스트 파일 및 결과 이미지가 출력 경로에 기록됩니다.






문제 점검 문제가 먼저 발생하거나 새로운 문제를 열 수있는 경우.
@rkshuai는 Model.py에서 Concat 기능에 대한 버그를 찾았습니다.
이 저장소가 도움이된다면 별표를주십시오. 감사해요.