PADDLEOCR2PYTORCH
تبسيط الصينية | إنجليزي
مقدمة
"الجنس الحر" Paddleoch.
يهدف هذا المشروع إلى:
- تعلم مجداف
- دع النماذج المدربة المتدربة تستخدم على Pytorch
- توفير مرجع للتجديف إلى Pytorch
يلاحظ
يتم نقل PytorchOCR بواسطة PaddleOCRv2.0+ إصدار الرسم البياني الديناميكي.
التحديثات الأخيرة
- 2024.02.20 PP-OCRV4 ، وتوفير نماذج الهاتف المحمول والخادم
- PP-OCRV4-Mobile: مع سرعة مماثلة ، سيتم تحسين تأثير المشهد الصيني بنسبة 4.5 ٪ مقارنة بـ PP-OCRV3 ، وسيتم تحسين المشهد الإنجليزي بنسبة 10 ٪ ، وسيتم زيادة متوسط دقة التعرف على 80 طرازات متعددة اللغات بأكثر من 8 ٪.
- PP-OCRV4-Server: تم إصدار نموذج OCR ذو أعلى دقة ، مع زيادة دقة نماذج الكشف في السيناريوهات الصينية والإنجليزية بنسبة 4.9 ٪ ، وزيادة دقة نماذج تحديد الهوية بنسبة 2 ٪.
- 2023.04.16 يمكن تحديد التعرف على الصيغة
- 2023.04.07 Text Super Super Segment Text Telescope
- 2022.10.17 التعرف على النص: Vitstr
- 2022.10.07 اكتشاف النص: DB ++
- 2022.07.24 خوارزمية الكشف عن النص (FCENET)
- 2022.07.16 خوارزمية التعرف على النص (SVTR)
- 2022.06.19 خوارزمية التعرف على النص (SAR)
- 2022.05.29 PP-OCRV3 ، عندما تكون السرعة قابلة للمقارنة ، تزداد تأثير المشهد الصيني بنسبة 5 ٪ مقارنة مع PP-OCRV2 ، ويزداد المشهد الإنجليزي بنسبة 11 ٪ ، وزاد متوسط دقة التعرف على 80 طرازات متعددة اللغات بأكثر من 5 ٪.
- 2022.05.14 PP-OCRV3 نموذج اكتشاف النص
- 2022.04.17 1 خوارزمية التعرف على النص (NRTR)
- 2022.03.20 1 خوارزمية الكشف عن النص (psenet)
- 2021.09.11 pp-ocrv2 ، تكون سرعة استنتاج وحدة المعالجة المركزية أعلى 220 ٪ من سرعة خادم PP-OCR ؛ التأثير أعلى بنسبة 7 ٪ من تأثير PP-OCR
- 2021.06.01 تحديث SRN
- 2021.04.25 تحديث خوارزمية التعرف على الورق AAAI 2021
- 2021.04.24 تحديث نادر
- 2021.04.12 تحديث starnet
- 2021.04.08 محدثة DB ، SAST ، الشرق ، Rosetta ، CRNN
- 2021.04.03 تم تحديث نموذج التعرف متعدد اللغات ، ويدعم حاليًا أكثر من 27 لغة ، وتنزيلات من النماذج متعددة اللغات ، بما في ذلك خطط المتابعة الصينية الصينية ، والإنجليزية ، والفرنسية ، والكورية ، واليابانية ، والإسبانية ، والبرتغالية ، والروسية ، والعربية ، وما إلى ذلك.
- 2021.01.10 مجانا نموذج OCR الصيني والإنجليزي المجاني
خاصية
نموذج الاستدلال عالي الجودة ، تأثير التعرف الدقيق
- سلسلة PP-OCR خفيفة الخفيفة: Detection + Direction Classifier + Idention
- سلسلة طرفي موبايل PTOCR_Mobile الخفيفة للغاية
- سلسلة PTOCR_Server العامة
- يدعم التعرف على الجمع الرقمي الصيني والإنجليزي ، والتعرف على النص العمودي ، والتعرف على النص الطويل
- يدعم الاعتراف متعدد اللغات: الكورية ، اليابانية ، الألمانية ، الفرنسية ، إلخ.
قائمة النماذج (محدثة)
الرابط تنزيل نموذج Pytorch:
Paddleocor Model Baidu Network Disk Link: https://pan.baidu.com/s/1getaprt2l_jqwhjwml0g9g رمز الاستخراج: LMV7
لمزيد من التنزيلات النموذجية (بما في ذلك متعدد اللغات) ، يمكنك الرجوع إلى تنزيل نموذج سلسلة PT-OCR V2.0
توثيق البرنامج التعليمي
- تثبيت سريع
- التنبؤ النموذج
- خط الميبات
- عرض تأثير
- مراجع
- التعليمات
- الرجوع إلى
تودو
PP-OCRV2 PIPLINE
[1] PP-ORAC هو نظام OCR العملي الخفيف للغاية. يتكون بشكل أساسي من ثلاثة أجزاء: اكتشاف نص DB ، وتصحيح إطار الكشف والتعرف على نص CRNN. يستخدم النظام 19 استراتيجيات فعالة لتحسين ونماذج كل وحدة من ثمانية جوانب: اختيار شبكة العمود الفقري وتعديله ، وتصميم رأس التنبؤ ، وزيادة البيانات ، واستراتيجية تحويل معدل التعلم ، واختيار معلمة التنظيم ، والاستخدام النموذجية المسبقة ، والتقصير التلقائي في النماذج الرقمية ، وحصل على مستوى الصينيين الخفيفون والإنجليزي مع الحجم الكلي للـ 3.5m و 2.8 مليون عامًا. لمزيد من التفاصيل ، يرجى الرجوع إلى الحل الفني PP-OCR https://arxiv.org/abs/2009.09941
[2] استنادًا إلى PP-OCR ، ركز PP-OCRV2 على التحسين في خمسة جوانب. يعتمد نموذج الكشف عن استراتيجية التقطير التعاونية التعاونية CML التعاونية واستراتيجية تكبير بيانات Copypaste ؛ يتبنى نموذج التعريف شبكة العمود الفقري LCNET خفيفة الوزن ، واستراتيجية UDML تحسن استراتيجية التقطير المعرفة وتعزيز وظيفة فقدان فقدان CTC (كما هو موضح في المربع الأحمر في الشكل أعلاه) ، مما يؤدي إلى تحسين سرعة الاستنتاج وتأثير التنبؤ. لمزيد من التفاصيل ، يرجى الرجوع إلى التقرير الفني PP-OCRV2.
عرض تأثير
الرجوع إلى
- https://github.com/paddlepaddle/paddleocr
- https://github.com/wenmuzhou/pytorchocr
- مجداف
- Pytorch
- https://github.com/frotms/image_classification_pytorch
- https://github.com/paddlepaddle/paddleocr/blob/release/2.7/doc/doc_ch/models_list.md