تنفيذ Pytorch الرسمي لكاشف النص الحرف | ورقة | نموذج ما قبل الولادة | التكميلية
Youngmin Baek ، Bado Lee ، Dongyoon Han ، Sangdoo Yun ، Hwalsuk Lee.
Clova AI Research ، Naver Corp.
تنفيذ Pytorch للكشف عن النصوص الحرفية التي تكتشف بشكل فعال منطقة النص من خلال استكشاف كل منطقة أحرف وتقارب بين الشخصيات. يتم الحصول على الصندوق المحيط بالنصوص بمجرد العثور على الحد الأدنى من المستطيلات المحددة على الخريطة الثنائية بعد منطقة الطابع العتبة وعشرات التقارب.

13 يونيو ، 2019 : التحديث الأولي 20 يوليو ، 2019 : تمت إضافة ما بعد المعالجة لنتيجة Polygon 28 سبتمبر ، 2019 : أضاف النموذج المدرب على IC15 ومصفوف الرابط
pip install -r requirements.txt
لم يتم تضمين رمز التدريب في هذا المستودع ، ولا يمكننا إصدار رمز التدريب الكامل لسبب IP.
| اسم النموذج | مجموعات البيانات المستخدمة | اللغات | غاية | رابط النموذج |
|---|---|---|---|---|
| عام | Synthtext ، IC13 ، IC17 | المهندس + MLT | لغرض عام | انقر |
| IC15 | Synthtext ، IC15 | المهندس | ل IC15 فقط | انقر |
| LinkRefiner | CTW1500 | - | تستخدم مع النموذج العام | انقر |
python test.py --trained_model=[weightfile] --test_folder=[folder path to test images]
سيتم حفظ صورة النتيجة وخرائط SoCTRE إلى ./result بشكل افتراضي.
--trained_model : نموذج قبل--text_threshold : عتبة ثقة النص--low_text : نصوص نص منخفضة--link_threshold : ارتباط عتبة الثقة--cuda : استخدم CUDA للاستدلال (الافتراضي: صحيح)--canvas_size : حجم الصورة القصوى للاستدلال--mag_ratio : نسبة تكبير الصور--poly : تمكين نتيجة نوع المضلع--show_time : عرض وقت المعالجة--test_folder : مسار المجلد لإدخال الصور--refine : استخدم مصفاة الرابط لمجموعة بيانات مستوى المجال--refiner_model : نموذج مصفاة ما قبل المفعول @inproceedings{baek2019character,
title={Character Region Awareness for Text Detection},
author={Baek, Youngmin and Lee, Bado and Han, Dongyoon and Yun, Sangdoo and Lee, Hwalsuk},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={9365--9374},
year={2019}
}
Copyright (c) 2019-present NAVER Corp.
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in
all copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
THE SOFTWARE.