paddleoc2pytorch
ภาษาจีนง่ายๆ | ภาษาอังกฤษ
การแนะนำ
"เพศฟรี" Paddleocr
โครงการนี้มีจุดมุ่งหมายเพื่อ:
- เรียนรู้ paddleoc
- ให้รุ่นที่ผ่านการฝึกอบรมของ Paddleoc ใช้กับ pytorch
- ให้การอ้างอิงสำหรับการพายเรือไปยัง pytorch
สังเกต
PytorchOCR ถูกพอร์ตโดย PaddleOCRv2.0+ เวอร์ชันกราฟแบบไดนามิก
อัปเดตล่าสุด
- 2024.02.20 pp-ocrv4 ให้บริการรุ่นมือถือและเซิร์ฟเวอร์
- PP-ICR4-MOBILE: ด้วยความเร็วที่เทียบเคียงได้เอฟเฟกต์ฉากจีนจะได้รับการปรับปรุง 4.5%เมื่อเทียบกับ PP-ICRV3 ฉากภาษาอังกฤษจะได้รับการปรับปรุง 10%และความแม่นยำในการรับรู้เฉลี่ยของ 80 ภาษาหลายภาษาจะเพิ่มขึ้นมากกว่า 8%
- PP-ICR4-Server: โมเดล OCR ที่มีความแม่นยำสูงสุดได้รับการปล่อยตัวด้วยความแม่นยำของแบบจำลองการตรวจจับในสถานการณ์จีนและอังกฤษเพิ่มขึ้น 4.9%และความแม่นยำของแบบจำลองการระบุตัวตนเพิ่มขึ้น 2%
- 2023.04.16 การระบุสูตรสามารถ
- 2023.04.07 TEXT SUPER SEGUTION TEXT TEXT TELESCOPE
- 2022.10.17 การจดจำข้อความ: Vitstr
- 2022.10.07 การตรวจจับข้อความ: DB ++
- 2022.07.24 อัลกอริทึมการตรวจจับข้อความ (FCENET)
- 2022.07.16 อัลกอริทึมการจดจำข้อความ (SVTR)
- 2022.06.19 อัลกอริทึมการจดจำข้อความ (SAR)
- 2022.05.29 pp-ocrv3 เมื่อความเร็วเทียบเคียงได้เอฟเฟกต์ฉากจีนเพิ่มขึ้น 5%เมื่อเทียบกับ PP-ICR2 ฉากภาษาอังกฤษจะเพิ่มขึ้น 11%และความแม่นยำในการรับรู้เฉลี่ย 80 ภาษาหลายภาษาเพิ่มขึ้นมากกว่า 5%
- 2022.05.14 รูปแบบการตรวจจับข้อความ pp-ocrv3
- 2022.04.17 1 อัลกอริทึมการจดจำข้อความ (NRTR)
- 2022.03.20 1 อัลกอริทึมการตรวจจับข้อความ (PSENET)
- 2021.09.11 pp-ocrv2 ความเร็วการอนุมาน CPU สูงกว่าเซิร์ฟเวอร์ PP-COR 220% เอฟเฟกต์สูงกว่า PP-COR Mobile 7%
- 2021.06.01 อัปเดต SRN
- 2021.04.25 อัปเดต AAAI 2021 อัลกอริทึมการระบุตัวตนแบบ end-to-end Paper PGNET
- 2021.04.24 อัปเดตหายาก
- 2021.04.12 อัปเดต Starnet
- 2021.04.08 DB อัปเดต, Sast, East, Rosetta, CRNN
- 2021.04.03 อัปเดตรูปแบบการจดจำหลายภาษาปัจจุบันรองรับมากกว่า 27 ภาษาและการดาวน์โหลดแบบจำลองหลายภาษารวมถึงภาษาจีนแบบง่าย ๆ จีนดั้งเดิมอังกฤษฝรั่งเศสเยอรมันเกาหลีญี่ปุ่นอิตาลีสเปนโปรตุเกสรัสเซียอาหรับ ฯลฯ
- 2021.01.10 โมเดล OCR ทั่วไปภาษาจีนและภาษาอังกฤษฟรี
มีลักษณะเฉพาะ
แบบจำลองการอนุมานคุณภาพสูงเอฟเฟกต์การจดจำที่แม่นยำ
- PP-Light Ultra-Light: Detection + Direction Classifier + Identification
- ซีรีย์เทอร์มินัลมือถือ PTOCR_MOBILE ที่มีน้ำหนักเบาเป็นพิเศษ
- ซีรี่ส์ PTOCR_SERVER ทั่วไป
- รองรับการจดจำการผสมผสานแบบดิจิทัลแบบจีนและภาษาอังกฤษการจดจำข้อความแนวตั้งและการจดจำข้อความที่ยาวนาน
- สนับสนุนการยอมรับหลายภาษา: เกาหลีญี่ปุ่นเยอรมันฝรั่งเศส ฯลฯ
รายการรุ่น (อัปเดต)
Pytorch Model ดาวน์โหลดลิงค์: https://pan.baidu.com/s/1r1delt8blgxeop2rqrejeg รหัสการแยก: 6clx
โมเดล Paddleocret Baidu Network Disk ลิงค์: https://pan.baidu.com/s/1getaprt2l_jqwhjwml0g9g รหัสการสกัด: LMV7
สำหรับการดาวน์โหลดรุ่นเพิ่มเติม (รวมถึงการพูดได้หลายภาษา) คุณสามารถอ้างถึงการดาวน์โหลดรุ่น PT-COR V2.0 Series
การสอนเอกสาร
- การติดตั้งอย่างรวดเร็ว
- การทำนายแบบจำลอง
- สานุศิษย์
- การแสดงผลเอฟเฟกต์
- การอ้างอิง
- คำถามที่พบบ่อย
- อ้างถึง
สิ่งที่ต้องทำ
pp-ocrv2 pipline
[1] PP-COR เป็นระบบ OCR ที่มีน้ำหนักเบาเป็นพิเศษ ส่วนใหญ่ประกอบด้วยสามส่วน: การตรวจจับข้อความ db, การแก้ไขกรอบการตรวจจับและการจดจำข้อความ CRNN ระบบใช้กลยุทธ์ที่มีประสิทธิภาพ 19 ข้อในการเพิ่มประสิทธิภาพและลดแบบจำลองของแต่ละโมดูลจากแปดด้าน: การเลือกเครือข่ายกระดูกสันหลังและการปรับการออกแบบหัวการทำนายการเพิ่มข้อมูลกลยุทธ์การเปลี่ยนแปลงอัตราการเรียนรู้การเลือกพารามิเตอร์การทำให้เป็นมาตรฐานการใช้แบบจำลองก่อนการฝึกอบรม สำหรับรายละเอียดเพิ่มเติมโปรดดูโซลูชันทางเทคนิคของ PP-COC
[2] ขึ้นอยู่กับ PP-COR, PP-ICR2 มุ่งเน้นไปที่การเพิ่มประสิทธิภาพในห้าด้าน รูปแบบการตรวจจับใช้กลยุทธ์การกลั่นความรู้การเรียนรู้ร่วมกันของ CML และกลยุทธ์การเพิ่มข้อมูลการเพิ่มข้อมูล copypaste รูปแบบการระบุตัวตนใช้เครือข่ายแบ็คโบนน้ำหนักเบา LCNET, UDML ปรับปรุงกลยุทธ์การกลั่นความรู้และการปรับปรุงฟังก์ชั่นการสูญเสียการสูญเสีย CTC (ดังแสดงในกล่องสีแดงในรูปด้านบน) ปรับปรุงความเร็วในการอนุมานและผลการทำนาย สำหรับรายละเอียดเพิ่มเติมโปรดดูรายงานทางเทคนิค PP-ICR2
การแสดงผลเอฟเฟกต์
อ้างถึง
- https://github.com/paddlepaddle/paddleocr
- https://github.com/wenmuzhou/pytorchocroc
- พายเรือ
- pytorch
- https://github.com/frotms/image_classification_pytorch
- https://github.com/paddlepaddle/paddleocr/blob/release/2.7/doc/doc_ch/models_list.md