Скачать Akshara Jaana - Akshara Jaana Source Code скачать

Akshara Jaana

AI Исходный код

Add Easyocr PaddleOCR to the package

Скачать

Акшараджаана

OCR для Каннады.

Aksharajaana-это пакет, который использует Tesseract OCR в бэкэнд, чтобы преобразовать текст каннады только для чтения в редактируемый формат. Особым особенностью этого является разделение столбцов на странице и, таким образом, облегчает чтение и редактирование. Рассмотрите возможность использования этого пакета, если это необходимо, и не стесняйтесь отправлять мне по почте для любых разъяснений.

Электронная почта: [email protected]
Ручка в Твиттере: https://twitter.com/navaneethakbh

Счастливого кодирования и установки.

Чтобы увидеть пакет Python, посетите https://pypi.org/project/aksharajaana/

Требования

Среда Conda предпочтительнее плавного использования

Aksharajaana (PIP Package) , проверьте последнюю доступную версию
Tesseract
Poppler

Подробности для установки

Ubuntu

Открыть терминал и выполнить команды ниже.

Установите требования в вашей системе

sudo apt-get update -y 
sudo apt-get install -y poppler-utils python3 python3-venv tesseract-ocr tesseract-ocr-kan

Установка пакетов для Aksharajaana
```
pip install --upgrade AksharaJaana
```

Окна

Установка Tesseract-OCR в систему
- Скачать Tesseract
  - перейти на сайт
  - Нажмите на tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe (64 bit) .
- Установите Tesseract для языка и сценария каннада
  - Откройте загруженный файл и нажмите Далее и примите соглашение.
  - Далее вы дадите возможность выбрать языки.
  - Выберите Каннаду как на сценарии, так и на языке
- Добавить Tesseract в путь
  - Проверьте, присутствует ли эта папка C:Program FilesTesseract-OCR . Если да, следуйте ниже процедуры
  - Добавить C:Program FilesTesseract-OCR в ваш системный путь, выполнив следующее
    1. Нажмите на Windows start button , найдите Edit the system environment variables , нажмите на переменные среды
    2. В рамках системных переменных ищите и дважды щелкните по пути, нажмите на New .
    3. Затем добавьте C:Program FilesTesseract-OCR , нажмите OK.
  - Если папка нет, вручную добавьте папку Tesseract-OCR в программные файлы в дискоте C, которые должны присутствовать в разделе загрузки (после извлечения), и следуйте той же процедуре
  - Смотрите полные документы.
Установка Poppler в систему
- Скачать Poppler
  - Перейти на эту страницу
  - Нажмите на poppler-0.54_x86
- Разируйте файл и копируйте файлы в C:UsersProgram Filespoppler-0.68.0_x86
- Добавить Poppler в путь
  - Добавьте C:Program Filespoppler-0.68.0_x86bin в ваш системный путь, выполнив следующее:
    1. Нажмите на кнопку «Запуск Windows», найдите редактирование переменных системной среды, нажмите на переменные среды
    2. Под системными переменными ищите и дважды щелкните по пути, нажмите на новый
    3. Затем добавьте C: users Program Files Poppler-0.68.0_x86 bin, нажмите OK.
Установка Python и PIP в системе (если PIP не установлена)
- Скачать Python
Установка пакетов для Aksharajaana
- Откройте командную строку
```
pip install AksharaJaana
```
Перезагрузить систему перед началом использования

Скрипт Python

 from AksharaJaana . main import OCREngine
from AksharaJaana . utils import ModelTypes , FileOperationUtils

ocr = OCREngine ( modelType = ModelTypes . Easyocr )
# choices are Paddleocr, Easyocr, Tesseract

text = ocr . get_text_from_file ( "Your file Path" ) 
print ( text )