
Um OCR para Kannada.
Aksharajaana é um pacote que usa o TESSERACT OCR no back-end para converter o texto Kannada somente leitura em formato editável. Um recurso especial disso é que ele pode separar colunas na página e, assim, facilitar a leitura e a edição. Considere usar este pacote, se necessário, e sinta -se à vontade para me enviar por e -mail para qualquer esclarecimento.
Codificação e instalação felizes.
Para ver o pacote Python, visite https://pypi.org/project/aksharajaana/
O ambiente de conda é preferido para o uso suave
Abra o terminal e execute os comandos abaixo.
Instale os requisitos em seu sistema
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanInstalando pacotes para Aksharajaana
pip install --upgrade AksharaJaanaInstalando o Tesseract-ocr no sistema
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .C:Program FilesTesseract-OCR está presente. Se sim, siga o procedimento abaixoC:Program FilesTesseract-OCR ao caminho do seu sistema fazendo o seguinteWindows start button , procure Edit the system environment variables , clique em Variáveis de ambienteNew .C:Program FilesTesseract-OCR , clique em OK.Instalando Poppler no sistema
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin ao caminho do sistema, fazendo o seguinte:Instalando o Python e o PIP no sistema (se o PIP não estiver instalado)
Instalando pacotes para Aksharajaana
Prompt de comando aberto
pip install AksharaJaanaReinicie o sistema antes de começar a usar
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )