使用Apple的視覺和語音API從圖像,PDF和音頻文件中提取文本的命令行應用程序。
![顯示文本的終端窗口:| %textra the-mueller-report.pdf -o report.txt |轉換:| - 輸入(448 pg)mueller-report.pdf | - 輸出全文報告.txt | | 16 of 448 [ - ] ETA:00:05:21(1.34 IT/s)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra需要Mac OS 13或更高版本才能訪問最新的VisionKit API。
安裝textra的最簡單方法是打開終端窗口並運行以下命令:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash或者,下載最新版本,解開它,然後將textra可執行文件放在您的$PATH上。
textra [options] FILE1 [FILE2...] [outputOptions]-h , --help :顯示高級幫助
-s , --silent :抑制非必需的輸出
-l , --locale :為文本識別指定語言環境(例如EN-US)
-v , --version :顯示版本號
-x , --outputStdout :將所有內容輸出到stdout(默認)
-o , --outputText :將所有內容輸出到單個文本文件
-t , --outputPageText :將每個文件/頁面輸出到文本文件
-p , --outputPositions :每個文件/頁面的輸出位置文本(實驗;結果可能與頁面文本不同)
textra audio.mp3 :從“ audio.mp3”中提取文本,然後輸出到stdout
textra page1.png page2.png -o combined.txt :從“ page1.png”和“ page2.png”中提取文本,然後將組合文本輸出到“ complined.txt”
textra doc.pdf -o doc.txt -t doc/page-{}.txt
textra image1.png -o text1.txt image2.png -o text2.txt :從“ image1.png”中提取文本,然後在“ text1.txt”上輸出;從“ image2.png”中提取文本,並在“ text2.txt”上輸出
textra image.png --outputPositions positionalText.json :從“ image.png”中提取位置文本,並在“ positionalText.json”上輸出輸出
要使用textra ,您必須至少提供一個輸入文件。
然後, textra將從輸入的圖像/PDF/音頻文件中提取所有文本。默認情況下, textra將將輸出打印到STDOUT,可以將其查看或管道輸送到另一個程序中。
您可以在任何方面使用上面的輸出選項將指定的文件提取到各種格式的磁盤。例如, textra doc.png -o page.txt -p page.json將以兩種格式提取“ doc.png”:作為頁面文本為“ page.txt”,作為位置文本為“ page.json”。
您可以用輸出選項點點輸入的鏈條,以精心控制多個提取文檔最終的位置。例如, textra doc.png -o image.txt speech.mp3 -o audio.txt將“ doc.png”提取為“ image.txt”和“ segress.mp3”,分別為“ audio.txt”。
對於寫入每個頁面( -t , -p )的輸出選項, textra允許一個輸出路徑,其中包含捲曲括號{} 。在PDF文件的情況下,這些括號將用頁碼替換,在圖像文件的情況下,基本文件名或在多個PDF文件的情況下baseFileName-pageNumber 。在沒有指定括號的情況下,Textra將在指定的路徑上附加破折號。
ERROR: Speech recognizer does not support on-device recognition :
如果收到此錯誤,則可能需要啟用命令,您可以在系統設置- >鍵盤- > destion- >啟用命令中完成。
翻轉命令設置可能不會立即解決錯誤。如果textra仍然提供此錯誤,或者您無法切換設置,請嘗試在應用程序中(例如終端)並單擊“開始命令”時單擊“編輯”菜單項。這可能會提示您再次啟用“命令”,並可能出現麥克風提示(您可以通過單擊“完成”立即解散)。
再次嘗試textra 。如果確實有效,則可以在系統設置中的任何時間安全地禁用命令。如果沒有,請提出問題。
麻省理工學院
此存儲庫處於早期階段,但歡迎捐款。請提交問題或隨時提交叉子並提出拉的請求。
非常感謝布蘭登·羅伯茨(Brandon Roberts)和馬科斯·霍爾塔(Marcos Huerta)對位置文字提取的幫助和鼓勵。