هذا هو إعادة تنفيذ Tensorflow من Psenet: شكل الكشف عن النص القوي مع شبكة توسيع المقياس التدريجي.
شكرا على المؤلف (@whai362) عمل رائع!
تدرب على ICDAR 2015 (مجموعة التدريب) + ICDAR2017 MLT (مجموعة التدريب):
رمز استخراج Baiduyun: PFFD
محرك Google
هذا النموذج ليس جيدًا مثل المقالة ، إنه مجرد مرجع. يمكنك Finetune عليها أو يمكنك القيام بالكثير من التحسين بناءً على هذا الرمز.
| قاعدة البيانات | دقة (٪) | يتذكر (٪) | F-Measure (٪) |
|---|---|---|---|
| ICDAR 2015 (VAL) | 74.61 | 80.93 | 77.64 |
إذا كنت ترغب في تدريب النموذج ، فيجب عليك توفير مسار مجموعة البيانات ، في مسار مجموعة البيانات ، يجب توفير ملف نصي GT منفصل لكل صورة ، وتأكد من أن ملف GT وملف الصورة له نفس الأسماء .
ثم قم بتشغيل Train.py مثل:
python train.py --gpu_list=0 --input_size=512 --batch_size_per_gpu=8 --checkpoint_path=./resnet_v1_50/
--training_data_path=./data/ocr/icdar2015/
إذا كان لديك أكثر من وحدة معالجة الرسومات ، يمكنك تمرير معرفات GPU إلى GPU_List (مثل -gpu_list = 0،1،2،3)
ملحوظة:
تشغيل eval.py مثل:
python eval.py --test_data_path=./tmp/images/ --gpu_list=0 --checkpoint_path=./resnet_v1_50/
--output_dir=./tmp/
سيتم كتابة ملف نصي وصورة نتيجة إلى مسار الإخراج.






إذا واجهت أي مشكلات فحص مشكلة أولاً ، أو يمكنك فتح مشكلة جديدة.
وجدت Rkshuai خطأ حول ميزات concat في model.py.
إذا كان هذا المستودع يساعدك , ، يرجى نجميه. شكرًا.