@jayakumar
Tesseract OCR Engine 5.2を使用した新しいTRモデルを新しいフォントでトレーニングします。
このプロジェクトは、Tesseract OCR -5.2に基づいています
新しいフォントを追加し、画像またはPDFでテキスト認識のためにモデルをトレーニングして、最良の精度でトレーニングできます。
現在のベストLSTM ENGモデルをベースモデルとして使用しています。
セットアップには公式のTesseract Repoを使用して、このレポを使用して要件を変更してトレーニングとテストを変更してください。
ページの読み込みについては、フォントリストの引数でフォント名を指定し、output_dir train/でディレクトリ名を指定します。
sudo src/training/tesstrain.sh - fonts_dir/usr/local/share/fonts - fontlist 'digital-7 mono' 'vitali slab fat、relument fall' 'falling sky、bold' - landata_only - langdata_dir langdata_lstm-trainine_tex tessdata - save_box_tiff - maxpages 500000 -output_dir train/directory_name
run ./autogen.sh
run ./configure - enable-debug
実行します
インストールを実行します
ldconfigを実行します
トレーニングを実行します
実行するトレーニングインストールを実行します
APTインストールpython3-pipを実行します
cp ./fonts/*/usr/local/share/fonts/
chmod +x/craining/auto.old.shを実行します
env tessdata_prefix =/ocr/training/tessdata
EntryPoint ["/cr/training/auto.old.sh"]