Appleのビジョンと音声APIを使用して、画像、PDF、およびオーディオファイルからテキストを抽出するコマンドラインアプリケーション。
![テキストを示す端子ウィンドウ:| %textra the-mueller-report.pdf -o Report.txt |変換:| - 入力(448 pg)the-mueller-report.pdf | -Utput Full Text Report.txt | | 16 of 448 [ - ] ETA:00:05:21(1.34 IT/s)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textraは、最新のVisionKit APIにアクセスするためにMac OSバージョン13以上を必要とします。
textraをインストールする最も簡単な方法は、端末ウィンドウを開き、次のコマンドを実行することです。
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bashまたは、最新リリースをダウンロードして、解凍して、 textra実行可能ファイルを$PATHのどこかに配置します。
textra [options] FILE1 [FILE2...] [outputOptions]-h 、 --help :高度なヘルプを表示します
-s 、 --silent :必須ではない出力を抑制します
-l 、 --locale :テキスト認識のためにロケール(en-usなど)を指定します
-v 、 --version :バージョン番号を表示します
-x 、 --outputStdout :すべてをstdoutに出力(デフォルト)
-o 、 --outputText :すべてを単一のテキストファイルに出力します
-t 、 --outputPageText :各ファイル/ページをテキストファイルに出力する
-p 、 --outputPositions :各ファイル/ページの出力位置テキスト(実験的、結果はページテキストと異なる場合があります)
textra audio.mp3 :「audio.mp3」からテキストを抽出し、stdoutに出力します
textra page1.png page2.png -o combined.txt :「page1.png」と「page2.png」からテキストを抽出し、結合テキストを「combined.txt」に出力します
textra doc.pdf -o doc.txt -t doc/page-{}.txt :「doc.pdf」からテキストを抽出し、2つの形式でテキストを抽出します。など)
textra image1.png -o text1.txt image2.png -o text2.txt :「image1.png」からテキストを抽出し、「text1.txt」で出力します。 「image2.png」からテキストを抽出し、「text2.txt」で出力します
textra image.png --outputPositions positionalText.json :「image.png」から「positionaltext.json」で出力から位置テキストを抽出します
textraを使用するには、少なくとも1つの入力ファイルを提供する必要があります。
textra 、入力された画像/PDF/オーディオファイルからすべてのテキストを抽出します。デフォルトでは、 textra出力をSTDOUTに印刷します。STDOUTでは、別のプログラムに表示またはパイプできます。
上記の出力オプションを任意の時点で使用して、指定されたファイルをさまざまな形式でディスクに抽出できます。たとえば、 textra doc.png -o page.txt -p page.json 「doc.png」を2つの形式で抽出します。
出力オプションを使用して入力のチェーンを区切ることができ、複数の抽出されたドキュメントがどこになるかを細かく制御できます。たとえば、 textra doc.png -o image.txt speech.mp3 -o audio.txtそれぞれ「doc.png」に「doc.png」と「speech.mp3」から「audio.txt」に抽出します。
各ページ( -t 、 -p )に書き込む出力オプションの場合、 textra巻き毛のブレースを含む出力パスを許可します{} 。これらのブレースは、PDFファイルの場合のページ番号、画像ファイルの場合のベースファイル名、または複数のPDFファイルの場合のbaseFileName-pageNumberで置き換えられます。ブレースを指定せずに、Textraはダッシュを追加し、その後、指定されたパスにページ番号/ベースファイル名を追加します。
ERROR: Speech recognizer does not support on-device recognition :
このエラーが発生した場合、システム設定- >キーボード- > dictation- > dictationを有効にすることができるディクテーションを有効にする必要がある場合があります。
ディクテーションの設定を反転すると、すぐにエラーが修正されない場合があります。 textraまだこのエラーを提供している場合、または設定を切り替えられない場合は、アプリケーション(端末など)にいるときにトップメニューバーから[編集]メニュー項目をクリックして[Dictationの開始]をクリックしてみてください。これにより、「ディクテーション」を再度有効にするように促され、マイクプロンプトが表示される場合があります(「完了」をクリックすることですぐに却下できます)。
もう一度textraをお試しください。それが機能する場合、システム設定のいつでもディクテーションを安全に無効にすることができます。そうでない場合は、問題を提出してください。
mit
このレポは初期段階にありますが、貢献は大歓迎です。問題を提出するか、お気軽にフォークして、プルリクエストを提供してください。
ポジショナルテキスト抽出の助けと励ましをしてくれたブランドンロバーツとマルコスフエルタに感謝します。