
Qiji-Font(Qijiti)は次のとおりです。
?声明:私のフォントは最近インターネット上で流通していますが、それらはすべて「 'ling' dongqi jiスタイル」と誤解されています。私の名前はリングドンで、フォントはQijiです。最後のものになりたい場合は、「 Lingdong Qijiスタイル」を最も重要なこととして使用する必要があります。 ?

| ユニークなグリフ | 覆われた文字* | スキャンされた本 |
|---|---|---|
| 4569 | 5916 | Li Changjiの詩/Huainan Honglieの説明 |
*単純化されたフォームは、従来のフォームに戻り、より一般的な従来のバリアントは、あまり一般的ではないバリアント形式に戻ります。
ステップI:高解像度PDFS(shuge.orgから)をダウンロードし、ページを画像に分割します。
ステップII:各ページの上にグリッドを手動で敷設して、文字の境界ボックスを生成します(自動コーナー検出アルゴリズムに置き換える可能性があります)。

ステップIII:グリッド上の各文字の低ポリマスクを生成し、サムネイルを保存します(OPENCVを使用)。まず、赤インクで印刷された注釈をきれいにするために、グレースケールから赤いチャネルが差し引かれます。次に、画像はしきい値で囲まれ、輪郭を追うアルゴリズムに供給されます。メトリックは、関心のあるキャラクターの一部である可能性が低い形状を破棄するために使用されます。 (このステップでは、最終的なグリフは生成されず、中間処理のための迅速な抽出のみを生成します。)

ステップIV:各サムネイルをニューラルネット中国のOCRに1つずつ供給してキャラクターを認識します(現在、中国語/darknet-ocr、低い検出率、平凡な精度、CPUで非常に遅い、より良い代替品を探しています)。
ステップV: OCRの出力を手動で判断:特定のキャラクターの最高の見えるインスタンスを選択し、フラグが誤って認識されたキャラクターを選択します。

ステップVI:最終文字セットの場合、各文字のファインラスターレンダリングを自動的に生成します。各キャラクターは、左右からピクセルを累積的にカウントすることにより、「視覚」中心に配置され、上部と下部に配置されているため、キャラクターの「重量」は、境界ボックスを中心にするのではなく、センターライン上にあります。 2つのしきい値を使用すると、グローバルなしきい値が拡張され、適応しきい値へのマスクとして機能するため、周囲のブジャーをブロックしながら詳細を維持します。

ステップVII:ラスター間トレースソフトウェアPotraceを使用して、ラスターレンダリングをSVGに変換します。 FontforgeのPythonライブラリは、最終的なフォントファイルを生成するために使用されます。終わり!
キャラクターの数が増えると、上記の手順の効率はますます低くなります。これは、加工された各本から得られた以前に見えない新しいキャラクターがよりまれでまれになるためです。目に見えないキャラクターのみをクリックしてそれらを選択することを伴う代替方法は、構築中です。
要件:
pip3 install opencv-python )brew install fontforgeを含む)メインコードは/workflowに含まれており、上記の手順に対応しています。コードのドキュメントはまだ実行されていません(まもなく)ので、興味があるかどうかはお問い合わせください。ご存知かもしれませんが、中国のフォントの作成にはたくさんの作業が必要なので、貢献は大歓迎です:)
Unicodeエントリポイントでソートされたすべてのユニークなグリフのシート、クリックして拡大します。 (これは失われたJPEGです。完全なPNGについては、こちらを確認してください。SVGについては、 node workflow/make_sheet.jsを実行してください)
