Приложение командной строки для извлечения текста из изображений, PDF-файлов и аудиофайлов с использованием Apple Vision и речевых API.
![Окно терминала, показывающее текст: | % textra the-mueller-report.pdf -o report.txt | Преобразование: | -Вход (448 пг) Mueller-report.pdf | - Вывод полный текстовый отчет.txt | | 16 из 448 [-] ETA: 00:05:21 (в 1.34 IT/S)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra требует версии Mac OS 13 или более, чтобы получить доступ к последним API Visionkit.
Самый простой способ установить textra - это открыть окно терминала и запустить следующую команду:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash В качестве альтернативы, загрузите последний релиз, расстегните его и разместите руководитель textra где -нибудь на своем $PATH .
textra [options] FILE1 [FILE2...] [outputOptions] -h , --help : показать продвинутую помощь
-s , --silent : подавить неосведомленный выход
-l , --locale : укажите локаль (например, En-US) для распознавания текста
-v , --version : показать номер версии
-x , --outputStdout : выводить все в Stdout (по умолчанию)
-o , --outputText : выводить все в один текстовый файл
-t , --outputPageText : вывод каждого файла/страницы в текстовый файл
-p , --outputPositions : выходной позиционный текст для каждого файла/страницы в JSON (экспериментальный; результаты могут отличаться от текста страницы)
textra audio.mp3 : извлечь текст из «audio.mp3» и вывода в stdout
textra page1.png page2.png -o combined.txt : извлечь текст из «page1.png» и «page2.png» и вывод комбинированного текста в «combicked.txt»
textra doc.pdf -o doc.txt -t doc/page-{}.txt : извлечь текст из «doc.pdf» и вывода в двух форматах: 1) Комбинированный текст всех страниц, хранящихся в «doc.txt» и 2) позиционного текста с каждой страницы, извлеченной на шаблоне «doc/page-{{}. Txt» (eg »doc/page-xtxt».
textra image1.png -o text1.txt image2.png -o text2.txt : извлечь текст из «image1.png» и вывода At "text1.txt"; Извлеките текст из "Image2.png" и вывод на "text2.txt"
textra image.png --outputPositions positionalText.json : извлечь позиционный текст из «image.png» и вывода по адресу "posipalaltext.json"
Чтобы использовать textra , вы должны предоставить хотя бы один входной файл.
Затем textra извлечет весь текст из введенного изображения/PDF/аудиофайлов. По умолчанию textra печатает вывод в Stdout, где его можно просмотреть или пройти в другую программу.
Вы можете использовать параметры вывода выше в любой точке для извлечения указанных файлов в диск в различных форматах. Например, textra doc.png -o page.txt -p page.json извлечет «doc.png» в двух форматах: как текст страницы в «page.txt» и как позиционный текст в «page.json».
Вы можете акцентировать цепи входов с опциями вывода для мелкого управления, где в конечном итоге будут оказаться несколько извлеченных документов. Например, textra doc.png -o image.txt speech.mp3 -o audio.txt извлекут «doc.png» в «image.txt» и «sherp.mp3» в «audio.txt» соответственно.
Для параметров вывода, которые записывают на каждую страницу ( -t , -p ), textra позволяет выходной путь, который содержит кудривые скобки {} . Эти скобки будут заменены номерами страниц в случае файла PDF, базовыми именами файлов в случае файлов изображений или baseFileName-pageNumber в случае нескольких файлов PDF. Без указания брекетов Textra добавит приборную панель, а затем номер страницы/базовое имя файла к указанному пути.
ERROR: Speech recognizer does not support on-device recognition :
Если вы получите эту ошибку, вам может потребоваться включена диктовка, которую вы можете выполнить в настройках системы -> Клавиатура -> Диктация -> Включить диктовку .
Перевернуть настройку диктовки может не сразу же исправить ошибку. Если textra по -прежнему предоставляет эту ошибку или если вы не можете переключить настройку, попробуйте щелкнуть элемент меню «Редактировать» из верхней строки меню, когда вы находитесь в приложении (например, терминале) и нажав «Начало диктовка». Это может побудить вас снова включить «диктовку», и может появиться подсказка из микрофона (которую вы можете сразу уволить, нажав «Готово»).
Попробуйте textra снова. Если это работает, вы можете безопасно отключить диктовку в любое время в настройках системы. Если это не так, пожалуйста, подайте проблему.
Грань
Это репо находится на ранних стадиях, но вклады приветствуются. Пожалуйста, отправьте проблему или не стесняйтесь разворачиваться и внести свой вклад.
Большое спасибо Брэндону Робертсу и Маркосу Хуэрте за помощь и поддержку с помощью позиционного извлечения текста.