textra Download - textra исходный код скачать

textra

Другой исходный код

v0.2.1

Скачать

Textra

Приложение командной строки для извлечения текста из изображений, PDF-файлов и аудиофайлов с использованием Apple Vision и речевых API.

Установка

Textra требует версии Mac OS 13 или более, чтобы получить доступ к последним API Visionkit.

Самый простой способ установить textra - это открыть окно терминала и запустить следующую команду:

curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash

В качестве альтернативы, загрузите последний релиз, расстегните его и разместите руководитель textra где -нибудь на своем $PATH .

Использование

textra [options] FILE1 [FILE2...] [outputOptions]

Параметры

-h , --help : показать продвинутую помощь

-s , --silent : подавить неосведомленный выход

-l , --locale : укажите локаль (например, En-US) для распознавания текста

-v , --version : показать номер версии

Параметры вывода

-x , --outputStdout : выводить все в Stdout (по умолчанию)

-o , --outputText : выводить все в один текстовый файл

-t , --outputPageText : вывод каждого файла/страницы в текстовый файл

-p , --outputPositions : выходной позиционный текст для каждого файла/страницы в JSON (экспериментальный; результаты могут отличаться от текста страницы)

Примеры

textra audio.mp3 : извлечь текст из «audio.mp3» и вывода в stdout

textra page1.png page2.png -o combined.txt : извлечь текст из «page1.png» и «page2.png» и вывод комбинированного текста в «combicked.txt»

textra doc.pdf -o doc.txt -t doc/page-{}.txt : извлечь текст из «doc.pdf» и вывода в двух форматах: 1) Комбинированный текст всех страниц, хранящихся в «doc.txt» и 2) позиционного текста с каждой страницы, извлеченной на шаблоне «doc/page-{{}. Txt» (eg »doc/page-xtxt».

textra image1.png -o text1.txt image2.png -o text2.txt : извлечь текст из «image1.png» и вывода At "text1.txt"; Извлеките текст из "Image2.png" и вывод на "text2.txt"

textra image.png --outputPositions positionalText.json : извлечь позиционный текст из «image.png» и вывода по адресу "posipalaltext.json"

Инструкции

Чтобы использовать textra , вы должны предоставить хотя бы один входной файл.

Затем textra извлечет весь текст из введенного изображения/PDF/аудиофайлов. По умолчанию textra печатает вывод в Stdout, где его можно просмотреть или пройти в другую программу.

Вы можете использовать параметры вывода выше в любой точке для извлечения указанных файлов в диск в различных форматах. Например, textra doc.png -o page.txt -p page.json извлечет «doc.png» в двух форматах: как текст страницы в «page.txt» и как позиционный текст в «page.json».

Вы можете акцентировать цепи входов с опциями вывода для мелкого управления, где в конечном итоге будут оказаться несколько извлеченных документов. Например, textra doc.png -o image.txt speech.mp3 -o audio.txt извлекут «doc.png» в «image.txt» и «sherp.mp3» в «audio.txt» соответственно.

Для параметров вывода, которые записывают на каждую страницу ( -t , -p ), textra позволяет выходной путь, который содержит кудривые скобки {} . Эти скобки будут заменены номерами страниц в случае файла PDF, базовыми именами файлов в случае файлов изображений или baseFileName-pageNumber в случае нескольких файлов PDF. Без указания брекетов Textra добавит приборную панель, а затем номер страницы/базовое имя файла к указанному пути.

Поиск неисправностей

ERROR: Speech recognizer does not support on-device recognition :
Если вы получите эту ошибку, вам может потребоваться включена диктовка, которую вы можете выполнить в настройках системы -> Клавиатура -> Диктация -> Включить диктовку .
Перевернуть настройку диктовки может не сразу же исправить ошибку. Если textra по -прежнему предоставляет эту ошибку или если вы не можете переключить настройку, попробуйте щелкнуть элемент меню «Редактировать» из верхней строки меню, когда вы находитесь в приложении (например, терминале) и нажав «Начало диктовка». Это может побудить вас снова включить «диктовку», и может появиться подсказка из микрофона (которую вы можете сразу уволить, нажав «Готово»).
Попробуйте textra снова. Если это работает, вы можете безопасно отключить диктовку в любое время в настройках системы. Если это не так, пожалуйста, подайте проблему.

Лицензия

Грань

Вклад

Это репо находится на ранних стадиях, но вклады приветствуются. Пожалуйста, отправьте проблему или не стесняйтесь разворачиваться и внести свой вклад.

Кредиты

Большое спасибо Брэндону Робертсу и Маркосу Хуэрте за помощь и поддержку с помощью позиционного извлечения текста.

Расширять

Дополнительная информация

Версия v0.2.1
Тип Другой исходный код
Время обновления 2025-05-09
размер 2.05MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

textra

Textra

Установка

Использование

Параметры

Параметры вывода

Примеры

Инструкции

Поиск неисправностей

Лицензия

Вклад

Кредиты

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express