Akshara Jaana
Add Easyocr PaddleOCR to the package

OCR للكانادا.
Aksharajaana هي حزمة تستخدم Tesseract OCR في الواجهة الخلفية لتحويل نص الكانادا للقراءة فقط إلى تنسيق قابل للتحرير. ميزة خاصة في هذا الأمر هي أنه يمكنه فصل أعمدة في الصفحة وبالتالي تسهيل القراءة والتحرير. فكر في استخدام هذه الحزمة إذا لزم الأمر ولا تتردد في إرسال أي توضيحات لي.
ترميز وتثبيت سعيد.
لمشاهدة حزمة Python تفضل بزيارة https://pypi.org/project/aksharajaana/
بيئة كوندا مفضلة للاستخدام السلس
فتح محطة وتنفيذ الأوامر أدناه.
تثبيت المتطلبات في نظامك
sudo apt-get update -y
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kanتثبيت الحزم لأكشاراجانا
pip install --upgrade AksharaJaanaتثبيت Tesseract-OCR في النظام
tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .C:Program FilesTesseract-OCR موجود. إذا كانت الإجابة بنعم ، اتبع الإجراء أدناهC:Program FilesTesseract-OCR إلى مسار النظام الخاص بك عن طريق القيام بما يليWindows start button ، ابحث عن Edit the system environment variables ، انقر فوق متغيرات البيئةNew .C:Program FilesTesseract-OCR ، انقر فوق "موافق".تثبيت poppler في النظام
poppler-0.54_x86C:UsersProgram Filespoppler-0.68.0_x86C:Program Filespoppler-0.68.0_x86bin إلى مسار النظام الخاص بك عن طريق القيام بما يلي:تثبيت Python و PIP في النظام (إذا لم يتم تثبيت PIP)
تثبيت الحزم لأكشاراجانا
فتح موجه الأوامر
pip install AksharaJaanaأعد تشغيل النظام قبل البدء في الاستخدام
from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils
ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract
text = ocr . get_text_from_file ( "Your file Path" )
print ( text )