Akshara Jaana
Add Easyocr PaddleOCR to the package

カンナダのOCR。
Aksharajaanaは、バックエンドのTesseract OCRを使用して、読み取り専用のKannadaテキストを編集可能な形式に変換するパッケージです。これの特別な機能は、ページ内の列を分離して、読みやすく編集しやすくすることです。必要に応じてこのパッケージを使用することを検討してください。明確にしてください。
ハッピーコーディングとインストール。
Pythonパッケージを見るには、https://pypi.org/project/aksharajaana/にアクセスしてください
滑らかな使用にはコンドラ環境が推奨されます
ターミナルを開き、以下のコマンドを実行します。
システムに要件をインストールします
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanAksharajaanaのパッケージのインストール
pip install --upgrade AksharaJaanaシステムにTesseract-occをインストールします
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit)をクリックします。C:Program FilesTesseract-OCRが存在するかどうかを確認します。はいの場合は、以下の手順に従ってくださいC:Program FilesTesseract-OCR次のことを行い、システムパスに追加しますWindows start buttonをクリックし、 Edit the system environment variablesを検索し、環境変数をクリックしますNewをクリックします。C:Program FilesTesseract-OCRを追加し、[OK]をクリックします。システムにポップラーをインストールします
poppler-0.54_x86をクリックしますC:UsersProgram Filespoppler-0.68.0_x86にコピーしますC:Program Filespoppler-0.68.0_x86bin次のことを行い、システムパスに追加します。システムにPythonとPIPをインストールする(PIPがインストールされていない場合)
Aksharajaanaのパッケージのインストール
コマンドプロンプトを開きます
pip install AksharaJaana使用を開始する前にシステムを再起動します
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )