使用Apple的视觉和语音API从图像,PDF和音频文件中提取文本的命令行应用程序。
![显示文本的终端窗口:| %textra the-mueller-report.pdf -o report.txt |转换:| - 输入(448 pg)mueller-report.pdf | - 输出全文报告.txt | | 16 of 448 [ - ] ETA:00:05:21(1.34 IT/s)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra需要Mac OS 13或更高版本才能访问最新的VisionKit API。
安装textra的最简单方法是打开终端窗口并运行以下命令:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash或者,下载最新版本,解开它,然后将textra可执行文件放在您的$PATH上。
textra [options] FILE1 [FILE2...] [outputOptions]-h , --help :显示高级帮助
-s , --silent :抑制非必需的输出
-l , --locale :为文本识别指定语言环境(例如EN-US)
-v , --version :显示版本号
-x , --outputStdout :将所有内容输出到stdout(默认)
-o , --outputText :将所有内容输出到单个文本文件
-t , --outputPageText :将每个文件/页面输出到文本文件
-p , --outputPositions :每个文件/页面的输出位置文本(实验;结果可能与页面文本不同)
textra audio.mp3 :从“ audio.mp3”中提取文本,然后输出到stdout
textra page1.png page2.png -o combined.txt :从“ page1.png”和“ page2.png”中提取文本,然后将组合文本输出到“ complined.txt”
textra doc.pdf -o doc.txt -t doc/page-{}.txt
textra image1.png -o text1.txt image2.png -o text2.txt :从“ image1.png”中提取文本,然后在“ text1.txt”上输出;从“ image2.png”中提取文本,并在“ text2.txt”上输出
textra image.png --outputPositions positionalText.json :从“ image.png”中提取位置文本,并在“ positionalText.json”上输出输出
要使用textra ,您必须至少提供一个输入文件。
然后, textra将从输入的图像/PDF/音频文件中提取所有文本。默认情况下, textra将将输出打印到STDOUT,可以将其查看或管道输送到另一个程序中。
您可以在任何方面使用上面的输出选项将指定的文件提取到各种格式的磁盘。例如, textra doc.png -o page.txt -p page.json将以两种格式提取“ doc.png”:作为页面文本为“ page.txt”,作为位置文本为“ page.json”。
您可以用输出选项点点输入的链条,以精心控制多个提取文档最终的位置。例如, textra doc.png -o image.txt speech.mp3 -o audio.txt将“ doc.png”提取为“ image.txt”和“ segress.mp3”,分别为“ audio.txt”。
对于写入每个页面( -t , -p )的输出选项, textra允许一个输出路径,其中包含卷曲括号{} 。在PDF文件的情况下,这些括号将用页码替换,在图像文件的情况下,基本文件名或在多个PDF文件的情况下baseFileName-pageNumber 。在没有指定括号的情况下,Textra将在指定的路径上附加破折号。
ERROR: Speech recognizer does not support on-device recognition :
如果收到此错误,则可能需要启用命令,您可以在系统设置- >键盘- > destion- >启用命令中完成。
翻转命令设置可能不会立即解决错误。如果textra仍然提供此错误,或者您无法切换设置,请尝试在应用程序中(例如终端)并单击“开始命令”时单击“编辑”菜单项。这可能会提示您再次启用“命令”,并可能出现麦克风提示(您可以通过单击“完成”立即解散)。
再次尝试textra 。如果确实有效,则可以在系统设置中的任何时间安全地禁用命令。如果没有,请提出问题。
麻省理工学院
此存储库处于早期阶段,但欢迎捐款。请提交问题或随时提交叉子并提出拉的请求。
非常感谢布兰登·罗伯茨(Brandon Roberts)和马科斯·霍尔塔(Marcos Huerta)对位置文字提取的帮助和鼓励。