Akshara Jaana
Add Easyocr PaddleOCR to the package

Kannada的OCR。
Aksharajaana是一个软件包,它使用后端使用Tesseract OCR将只读的Kannada文本转换为可编辑的格式。它的一个特殊功能是它可以分开页面中的列,从而使其更易于阅读和编辑。如果需要,请考虑使用此软件包,并随意寄给我以进行任何澄清。
快乐的编码和安装。
要查看Python包裹访问https://pypi.org/project/aksharajaana/
康达环境是平稳使用的首选
打开终端并在下面执行命令。
在系统中安装要求
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kan为Aksharajaana安装包裹
pip install --upgrade AksharaJaana在系统中安装Tesseract-OR
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) 。C:Program FilesTesseract-OCR是否存在。如果是,请遵循以下程序C:Program FilesTesseract-OCR到您的系统路径Windows start button ,搜索Edit the system environment variables ,单击环境变量New 。C:Program FilesTesseract-OCR ,单击“确定”。在系统中安装流行音乐
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin操作:在系统中安装Python和PIP(如果未安装PIP)
为Aksharajaana安装包裹
打开命令提示
pip install AksharaJaana开始使用之前,请重新启动系统
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )