
Eine OCR für Kannada.
Aksharajaana ist ein Paket, das Tesseract OCR im Backend verwendet, um den selbst schreibgeschützten Kannada-Text in das editable Format umzuwandeln. Eine spezielle Merkmale davon ist, dass es Spalten auf der Seite trennen und so das Lesen und Bearbeiten erleichtert. Erwägen Sie, dieses Paket gegebenenfalls zu verwenden, und schicken Sie mir gerne für Klarstellungen aus.
Glückliche Codierung und Installation.
Um das Python -Paket zu sehen, besuchen Sie https://pypi.org/project/aksharajaana/
Die Kondaumgebung wird für den reibungslosen Gebrauch bevorzugt
Öffnen Sie Terminal und führen Sie die folgenden Befehle aus.
Installieren Sie die Anforderungen in Ihrem System
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanInstallieren von Paketen für Aksharajaana
pip install --upgrade AksharaJaanaInstallation von Tesseract-OCR im System
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .C:Program FilesTesseract-OCR vorhanden ist. Wenn ja, folgen Sie den folgenden VerfahrenC:Program FilesTesseract-OCR hinzu, indem Sie Folgendes durchführenWindows start button , Edit the system environment variablesNew .C:Program FilesTesseract-OCR , klicken Sie auf OK.Installieren von Poppler im System
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin indem Sie Folgendes durchführen:Installieren von Python und PIP im System (wenn PIP nicht installiert ist)
Installieren von Paketen für Aksharajaana
Öffnen Sie die Eingabeaufforderung
pip install AksharaJaanaStarten Sie das System neu, bevor Sie beginnen
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )