Eine Befehlszeilenanwendung zum Extrahieren von Text aus Bildern, PDFs und Audiodateien mithilfe von Apples Vision- und Sprach-APIs.
![Ein Terminalfenster mit dem Text: | % Textra the-Mueller-report.pdf -o report.txt | Konvertieren: | -Eingabe (448 pg) The-Mueller-Report.pdf | - Volltext -Bericht ausgeben.txt | | 16 von 448 [-] ETA: 00:05:21 (bei 1,34 IT/S)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra erfordert Mac OS Version 13 oder höher, um auf die neuesten APIs von Visionkit zuzugreifen.
Der einfachste Weg, textra zu installieren, besteht darin, ein Terminalfenster zu öffnen und den folgenden Befehl auszuführen:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash Laden Sie alternativ die neueste Version herunter, entpacken Sie sie und platzieren Sie die textra -ausführbare Datei irgendwo auf Ihrem $PATH .
textra [options] FILE1 [FILE2...] [outputOptions] -h , --help : Zeigen Sie erweiterte Hilfe
-s , --silent : Unterdrückung der nicht essentiellen Ausgabe
-l , --locale : Geben Sie ein Gebietsschema an (z. B. En-US) für die Texterkennung
-v , --version : Versionsnummer anzeigen
-x , --outputStdout : Ausgabe alles auf stdout (Standard) ausgeben
-o , --outputText : Ausgabe alles in einer einzelnen Textdatei ausgeben
-t , --outputPageText : Ausgabe jeder Datei/Seite in eine Textdatei aus.
-p , --outputPositions : Ausgabepositionentext für jede Datei/Seite zu JSON (experimentelle; Ergebnisse können sich vom Seitentext unterscheiden)
textra audio.mp3 : Extrahieren Sie den Text aus "audio.mp3" und Ausgabe an stdout
textra page1.png page2.png -o combined.txt : extrahieren Sie den Text aus "Seite1.png" und "page2.png" und geben Sie den kombinierten Text auf "kombiniert.txt" aus.
textra doc.pdf -o doc.txt -t doc/page-{}.txt : Text aus "doc.pdf" extrahieren und in zwei Formaten ausgeben: 1) Kombinierter Text aller Seiten, die in "doc.txt" und 2) Positionstext aus jedem auf dem Muster extrahierten "doc/page/page-
textra image1.png -o text1.txt image2.png -o text2.txt : Text aus "image1.png" extrahieren und unter "text1.txt" ausgeben; Text aus "Image2.png" extrahieren und unter "text2.txt" ausgeben.
textra image.png --outputPositions positionalText.json : Positionstext aus "Image.png" und Ausgabe unter "PositionAltext.json" extrahieren
Um textra zu verwenden, müssen Sie mindestens eine Eingabedatei bereitstellen.
textra extrahiert dann den gesamten Text aus den eingegebenen Bild/PDF/Audio -Dateien. Standardmäßig druckt textra die Ausgabe in STDOut, wo sie in ein anderes Programm betrachtet oder geleitet werden kann.
Sie können die obigen Ausgabeoptionen an jedem Punkt verwenden, um die angegebenen Dateien in verschiedenen Formaten an die Festplatte zu extrahieren. Zum Beispiel wird textra doc.png -o page.txt -p page.json in zwei Formaten "doc.png" extrahiert: als Seitentext zu "page.txt" und als Positionentext zu "Page.json".
Sie können Ketten von Eingängen mit Ausgaboptionen untersuchen, um fein zu steuern, wo mehrere extrahierte Dokumente enden. Zum Beispiel wird textra doc.png -o image.txt speech.mp3 -o audio.txt "doc.png" an "Image.txt" und "rede.mp3" auf "audio.txt" extrahiert.
Für Ausgabeoptionen, die auf jede Seite ( -t , -p ) schreiben, ermöglicht textra einen Ausgangspfad, der lockige Klammern enthält {} . Diese Klammern werden im Fall einer PDF-Datei, Basis-Dateinamen im Fall von Bilddateien oder baseFileName-pageNumber im Fall mehrerer PDF-Dateien durch Seitennummern ersetzt. Ohne die Klammern anzugeben, fügt Textra einen Dash an, gefolgt vom Namen der Seitennummer/des Basisdateins an den angegebenen Pfad.
ERROR: Speech recognizer does not support on-device recognition :
Wenn Sie diesen Fehler erhalten, müssen Sie möglicherweise Diktierungen aktiviert, die Sie in Systemeinstellungen -> Tastatur -> Diktat -> Diktat aktivieren können.
Durch das Durchdrehen der Diktateinstellung kann der Fehler nicht sofort festgelegt werden. Wenn textra diesen Fehler weiterhin bereitstellt oder die Einstellung nicht umschalten kann, klicken Sie auf den Menüelement "Bearbeiten" in der oberen Menüleiste, wenn Sie in einer Anwendung sind (z. B. Terminal), und klicken Sie auf "Diktat starten". Dies kann Sie dazu veranlassen, "Diktat" erneut zu aktivieren, und eine Mikrofonaufforderung kann möglicherweise angezeigt werden (was Sie sofort abtun, indem Sie auf "Fertig" klicken).
Versuchen Sie es noch einmal textra . Wenn es funktioniert, können Sie Diktierungen jederzeit in den Systemeinstellungen sicher deaktivieren. Wenn dies nicht der Fall ist, stellen Sie bitte ein Problem ein.
MIT
Dieses Repo befindet sich im frühen Stadium, aber Beiträge sind willkommen. Bitte geben Sie ein Problem ein oder können Sie eine Gabelung geben und eine Pull -Anfrage beibehalten.
Vielen Dank an Brandon Roberts und Marcos Huerta für ihre Hilfe und Ermutigung durch die Extraktion von Positionstext.