Text Recognition OCRダウンロード - Text Recognition OCRソースコードのダウンロード

Text Recognition OCR

フォントのダウンロード

1.0.0

ダウンロード

@jayakumar

テキスト認識-cr

Tesseract OCR Engine 5.2を使用した新しいTRモデルを新しいフォントでトレーニングします。

Tesseract OCR

このプロジェクトは、Tesseract OCR -5.2に基づいています

新しいフォントを追加し、画像またはPDFでテキスト認識のためにモデルをトレーニングして、最良の精度でトレーニングできます。

現在のベストLSTM ENGモデルをベースモデルとして使用しています。

セットアップには公式のTesseract Repoを使用して、このレポを使用して要件を変更してトレーニングとテストを変更してください。

ページの読み込みについては、フォントリストの引数でフォント名を指定し、output_dir train/でディレクトリ名を指定します。

sudo src/training/tesstrain.sh - fonts_dir/usr/local/share/fonts - fontlist 'digital-7 mono' 'vitali slab fat、relument fall' 'falling sky、bold' - landata_only - langdata_dir langdata_lstm-trainine_tex tessdata - save_box_tiff - maxpages 500000 -output_dir train/directory_name