
Un OCR pour Kannada.
Aksharajaana est un package qui utilise Tesseract OCR dans le backend pour convertir le texte Kannada en lecture seule au format modifiable. Une caractéristique spéciale de ceci est qu'elle peut séparer les colonnes de la page et le rendre plus facile à lire et à modifier. Envisagez d'utiliser ce package si nécessaire et n'hésitez pas à m'envoyer par la poste pour toute clarification.
Codage et installation heureux.
Pour voir le package Python, visitez https://pypi.org/project/aksharajaana/
L'environnement conda est préféré pour l'utilisation en douceur
Ouvrez le terminal et exécutez les commandes ci-dessous.
Installez les exigences dans votre système
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanInstallation de packages pour aksharajaana
pip install --upgrade AksharaJaanaInstallation de Tesseract-OCr dans le système
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .C:Program FilesTesseract-OCR est présent. Si oui, suivez la procédure ci-dessousC:Program FilesTesseract-OCR à votre chemin système en effectuant ce qui suitWindows start button , recherchez Edit the system environment variables , cliquez sur les variables environnementalesNew .C:Program FilesTesseract-OCR , cliquez sur OK.Installation de Poppler dans le système
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin sur votre chemin système en effectuant les éléments suivants:Installation de Python et PIP dans le système (si PIP n'est pas installé)
Installation de packages pour aksharajaana
Invite de commande ouverte
pip install AksharaJaanaRedémarrez le système avant de commencer à utiliser
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )