
OCR untuk Kannada.
Aksharajaana adalah paket yang menggunakan Tesseract OCR di backend untuk mengonversi teks Kannada hanya baca menjadi format yang dapat diedit. Fitur khusus dari ini adalah dapat memisahkan kolom di halaman dan dengan demikian membuatnya lebih mudah dibaca dan diedit. Pertimbangkan untuk menggunakan paket ini jika perlu dan jangan ragu untuk mengirimi saya klarifikasi.
Selamat mengkode dan menginstal.
Untuk melihat paket Python, kunjungi https://pypi.org/project/aksharajaana/
Lingkungan Conda lebih disukai untuk penggunaan yang lancar
Buka Terminal dan jalankan perintah di bawah ini.
Pasang persyaratan di sistem Anda
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanMemasang paket untuk Aksharajaana
pip install --upgrade AksharaJaanaMenginstal Tesseract-OCR di sistem
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .C:Program FilesTesseract-OCR hadir. Jika ya, ikuti prosedur di bawah iniC:Program FilesTesseract-OCR ke jalur sistem Anda dengan melakukan hal berikutWindows start button , cari Edit the system environment variables , klik pada variabel lingkunganNew .C:Program FilesTesseract-OCR , klik OK.Menginstal Poppler di sistem
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin ke jalur sistem Anda dengan melakukan hal berikut:Memasang Python dan Pip di sistem (jika Pip tidak terpasang)
Memasang paket untuk Aksharajaana
buka command prompt
pip install AksharaJaanaReboot sistem sebelum mulai menggunakan
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )