
Qiji-Font (Qijiti) คือ:
- คำแถลง: ฟอนต์ของฉันได้รับการเผยแพร่บนอินเทอร์เน็ตเมื่อเร็ว ๆ นี้ แต่พวกเขาทั้งหมดเข้าใจผิดว่าเป็น "Ling 'สไตล์ Dongqi Ji" ชื่อของฉัน คือ Lingdong และตัวอักษร คือ Qiji ; หากคุณต้องการเป็นคนสุดท้ายคุณควรใช้ " Lingdong Qiji Style " เป็นสิ่งที่สำคัญที่สุดดังนั้นฉันหวังว่าคุณจะรู้ได้ ?

| ร่ายมนตร์ที่เป็นเอกลักษณ์ | อักขระที่ครอบคลุม* | สแกนหนังสือ |
|---|---|---|
| 4569 | 5916 | บทกวีของ Li Changji/คำอธิบายของ Huainan Honglie |
* รูปแบบที่เรียบง่ายกลับไปเป็นรูปแบบดั้งเดิมตัวแปรดั้งเดิมที่พบบ่อยมากขึ้นกลับไปเป็นรูปแบบตัวแปรที่น้อยกว่า
ขั้นตอนที่ 1: ดาวน์โหลด PDF ความละเอียดสูง (จาก shuge.org) และแยกหน้าลงในรูปภาพ
ขั้นตอนที่สอง: วางกริดด้วยตนเองที่ด้านบนของแต่ละหน้าเพื่อสร้างกล่องขอบเขตสำหรับอักขระ (อาจเปลี่ยนได้โดยอัลกอริทึมการตรวจจับมุมอัตโนมัติ)

ขั้นตอนที่ III: สร้างหน้ากากโพลีต่ำสำหรับตัวละครแต่ละตัวบนกริดและบันทึกรูปขนาดย่อ (โดยใช้ openCV) ก่อนอื่นช่องสีแดงจะถูกลบออกจากระดับสีเทาเพื่อทำความสะอาดคำอธิบายประกอบที่พิมพ์ด้วยหมึกสีแดง ถัดไปภาพจะถูกกำหนดและป้อนเข้าสู่อัลกอริทึมการติดตามรูปร่าง ตัวชี้วัดจะถูกใช้เพื่อทิ้งรูปร่างที่ไม่น่าจะเป็นส่วนหนึ่งของตัวละครที่น่าสนใจ (ขั้นตอนนี้ไม่ได้สร้างร่ายมนตร์ขั้นสุดท้ายเพียงการสกัดอย่างรวดเร็วและแบบกระจายสำหรับการประมวลผลระดับกลาง)

ขั้นตอนที่ IV: ป้อนภาพขนาดย่อแต่ละตัวทีละตัวใน Neural-Net Chinese OCR เพื่อรับรู้ถึงตัวละคร (ปัจจุบันใช้ Chineseoc/Darknet-MOR, อัตราการตรวจจับต่ำ, ความแม่นยำปานกลาง, ช้ามากใน CPU, มองหาทางเลือกที่ดีกว่า)
ขั้นตอนที่ V: ตัดสินเอาท์พุท OCR ด้วยตนเอง: เลือกอินสแตนซ์ที่ดูดีที่สุดของตัวละครที่กำหนดและธงตัวละครที่ได้รับการยอมรับอย่างไม่ถูกต้อง

ขั้นตอนที่ VI: สำหรับชุดอักขระสุดท้ายให้สร้างการเรนเดอร์แรสเตอร์ที่ดีของตัวละครแต่ละตัวโดยอัตโนมัติ ตัวละครแต่ละตัวจะถูกวางไว้ที่ศูนย์ "ภาพ" โดยการนับพิกเซลจากซ้ายและขวารวมทั้งด้านบนและด้านล่างเพื่อให้ "น้ำหนัก" ของตัวละครอยู่บนเส้นตรงกลางซึ่งตรงข้ามกับศูนย์กลางของกล่อง มีการใช้วิธีการแบบเกณฑ์สองวิธีเกณฑ์ระดับโลกขยายตัวและทำหน้าที่เป็นหน้ากากกับเกณฑ์การปรับตัวซึ่งจะรักษารายละเอียดในขณะที่ปิดกั้น boogers รอบ ๆ

ขั้นตอนที่ VII: ซอฟต์แวร์การติดตาม Raster-to-Vector Potrace ใช้เพื่อแปลงการเรนเดอร์แรสเตอร์เป็น SVG Library Python ของ Fontforge ใช้เพื่อสร้างไฟล์ตัวอักษรสุดท้าย เสร็จแล้ว!
เมื่อจำนวนอักขระเพิ่มขึ้นขั้นตอนข้างต้นจะมีประสิทธิภาพน้อยลงเนื่องจากตัวละครใหม่ที่มองไม่เห็นก่อนหน้านี้ที่ได้รับจากหนังสือแต่ละเล่มที่ประมวลผลจะหายากและหายาก วิธีทางเลือกที่เกี่ยวข้องกับการคลิกเฉพาะอักขระที่มองไม่เห็นเพื่อเลือกพวกเขาอยู่ระหว่างการก่อสร้าง
ความต้องการ:
pip3 install opencv-python )brew install fontforge ) รหัสหลักมีอยู่ใน /workflow และสอดคล้องกับขั้นตอนที่อธิบายไว้ข้างต้น เอกสารสำหรับรหัสยังไม่ได้ทำ (เร็ว ๆ นี้) ดังนั้นอย่าลังเลที่จะสอบถามหากสนใจ อย่างที่คุณอาจสังเกตเห็นว่ามีงานมากมายที่เกี่ยวข้องกับการทำแบบอักษรจีนดังนั้นการมีส่วนร่วมจึงยินดีต้อนรับมาก :)
แผ่นร่ายมนตร์ที่ไม่ซ้ำกันทั้งหมดจัดเรียงตามจุดเข้า Unicode คลิกเพื่อขยาย (นี่คือ Losty JPEG สำหรับ PNG เต็มรูปแบบตรวจสอบที่นี่สำหรับ SVG เรียกใช้ node workflow/make_sheet.js )
