
Un OCR para Kannada.
Aksharajaana es un paquete que utiliza Tesseract OCR en el backend para convertir el texto Kannada de solo lectura a formato editable. Una característica especial de esto es que puede separar las columnas en la página y, por lo tanto, facilitar la lectura y editar. Considere usar este paquete si es necesario y no dude en enviarme por correo para cualquier aclaración.
Feliz codificación e instalación.
Para ver el paquete Python, visite https://pypi.org/project/aksharajaana/
Se prefiere el entorno de conda para el uso suave
Abra la terminal y ejecute los comandos a continuación.
Instale los requisitos en su sistema
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanInstalación de paquetes para Aksharajaana
pip install --upgrade AksharaJaanaInstalación de Tesseract-OocR en el sistema
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .C:Program FilesTesseract-OCR está presente. En caso afirmativo, siga el procedimiento a continuaciónC:Program FilesTesseract-OCR a su ruta del sistema haciendo lo siguienteWindows start button , busque Edit the system environment variables , haga clic en las variables de entornoNew .C:Program FilesTesseract-OCR , haga clic en Aceptar.Instalación de Poppler en el sistema
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin a su ruta del sistema haciendo lo siguiente:Instalación de Python y PIP en el sistema (si PIP no está instalado)
Instalación de paquetes para Aksharajaana
Abra el símbolo del sistema
pip install AksharaJaanaReiniciar el sistema antes de comenzar a usar
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )