Akshara Jaana
Add Easyocr PaddleOCR to the package

Kannada的OCR。
Aksharajaana是一個軟件包,它使用後端使用Tesseract OCR將只讀的Kannada文本轉換為可編輯的格式。它的一個特殊功能是它可以分開頁面中的列,從而使其更易於閱讀和編輯。如果需要,請考慮使用此軟件包,並隨意寄給我以進行任何澄清。
快樂的編碼和安裝。
要查看Python包裹訪問https://pypi.org/project/aksharajaana/
康達環境是平穩使用的首選
打開終端並在下面執行命令。
在系統中安裝要求
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kan為Aksharajaana安裝包裹
pip install --upgrade AksharaJaana在系統中安裝Tesseract-OR
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) 。C:Program FilesTesseract-OCR是否存在。如果是,請遵循以下程序C:Program FilesTesseract-OCR到您的系統路徑Windows start button ,搜索Edit the system environment variables ,單擊環境變量New 。C:Program FilesTesseract-OCR ,單擊“確定”。在系統中安裝流行音樂
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin操作:在系統中安裝Python和PIP(如果未安裝PIP)
為Aksharajaana安裝包裹
打開命令提示
pip install AksharaJaana開始使用之前,請重新啟動系統
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )