textra Download - textra Source Code Download

textra

Anderer Quellcode

v0.2.1

Herunterladen

Textra

Eine Befehlszeilenanwendung zum Extrahieren von Text aus Bildern, PDFs und Audiodateien mithilfe von Apples Vision- und Sprach-APIs.

Installation

Textra erfordert Mac OS Version 13 oder höher, um auf die neuesten APIs von Visionkit zuzugreifen.

Der einfachste Weg, textra zu installieren, besteht darin, ein Terminalfenster zu öffnen und den folgenden Befehl auszuführen:

curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash

Laden Sie alternativ die neueste Version herunter, entpacken Sie sie und platzieren Sie die textra -ausführbare Datei irgendwo auf Ihrem $PATH .

Verwendung

textra [options] FILE1 [FILE2...] [outputOptions]

Optionen

-h , --help : Zeigen Sie erweiterte Hilfe

-s , --silent : Unterdrückung der nicht essentiellen Ausgabe

-l , --locale : Geben Sie ein Gebietsschema an (z. B. En-US) für die Texterkennung

-v , --version : Versionsnummer anzeigen

Ausgabeoptionen

-x , --outputStdout : Ausgabe alles auf stdout (Standard) ausgeben

-o , --outputText : Ausgabe alles in einer einzelnen Textdatei ausgeben

-t , --outputPageText : Ausgabe jeder Datei/Seite in eine Textdatei aus.

-p , --outputPositions : Ausgabepositionentext für jede Datei/Seite zu JSON (experimentelle; Ergebnisse können sich vom Seitentext unterscheiden)

Beispiele

textra audio.mp3 : Extrahieren Sie den Text aus "audio.mp3" und Ausgabe an stdout

textra page1.png page2.png -o combined.txt : extrahieren Sie den Text aus "Seite1.png" und "page2.png" und geben Sie den kombinierten Text auf "kombiniert.txt" aus.

textra doc.pdf -o doc.txt -t doc/page-{}.txt : Text aus "doc.pdf" extrahieren und in zwei Formaten ausgeben: 1) Kombinierter Text aller Seiten, die in "doc.txt" und 2) Positionstext aus jedem auf dem Muster extrahierten "doc/page/page-

textra image1.png -o text1.txt image2.png -o text2.txt : Text aus "image1.png" extrahieren und unter "text1.txt" ausgeben; Text aus "Image2.png" extrahieren und unter "text2.txt" ausgeben.

textra image.png --outputPositions positionalText.json : Positionstext aus "Image.png" und Ausgabe unter "PositionAltext.json" extrahieren

Anweisungen

Um textra zu verwenden, müssen Sie mindestens eine Eingabedatei bereitstellen.

textra extrahiert dann den gesamten Text aus den eingegebenen Bild/PDF/Audio -Dateien. Standardmäßig druckt textra die Ausgabe in STDOut, wo sie in ein anderes Programm betrachtet oder geleitet werden kann.

Sie können die obigen Ausgabeoptionen an jedem Punkt verwenden, um die angegebenen Dateien in verschiedenen Formaten an die Festplatte zu extrahieren. Zum Beispiel wird textra doc.png -o page.txt -p page.json in zwei Formaten "doc.png" extrahiert: als Seitentext zu "page.txt" und als Positionentext zu "Page.json".

Sie können Ketten von Eingängen mit Ausgaboptionen untersuchen, um fein zu steuern, wo mehrere extrahierte Dokumente enden. Zum Beispiel wird textra doc.png -o image.txt speech.mp3 -o audio.txt "doc.png" an "Image.txt" und "rede.mp3" auf "audio.txt" extrahiert.

Für Ausgabeoptionen, die auf jede Seite ( -t , -p ) schreiben, ermöglicht textra einen Ausgangspfad, der lockige Klammern enthält {} . Diese Klammern werden im Fall einer PDF-Datei, Basis-Dateinamen im Fall von Bilddateien oder baseFileName-pageNumber im Fall mehrerer PDF-Dateien durch Seitennummern ersetzt. Ohne die Klammern anzugeben, fügt Textra einen Dash an, gefolgt vom Namen der Seitennummer/des Basisdateins an den angegebenen Pfad.

Fehlerbehebung

ERROR: Speech recognizer does not support on-device recognition :
Wenn Sie diesen Fehler erhalten, müssen Sie möglicherweise Diktierungen aktiviert, die Sie in Systemeinstellungen -> Tastatur -> Diktat -> Diktat aktivieren können.
Durch das Durchdrehen der Diktateinstellung kann der Fehler nicht sofort festgelegt werden. Wenn textra diesen Fehler weiterhin bereitstellt oder die Einstellung nicht umschalten kann, klicken Sie auf den Menüelement "Bearbeiten" in der oberen Menüleiste, wenn Sie in einer Anwendung sind (z. B. Terminal), und klicken Sie auf "Diktat starten". Dies kann Sie dazu veranlassen, "Diktat" erneut zu aktivieren, und eine Mikrofonaufforderung kann möglicherweise angezeigt werden (was Sie sofort abtun, indem Sie auf "Fertig" klicken).
Versuchen Sie es noch einmal textra . Wenn es funktioniert, können Sie Diktierungen jederzeit in den Systemeinstellungen sicher deaktivieren. Wenn dies nicht der Fall ist, stellen Sie bitte ein Problem ein.

Lizenz

MIT

Beiträge

Dieses Repo befindet sich im frühen Stadium, aber Beiträge sind willkommen. Bitte geben Sie ein Problem ein oder können Sie eine Gabelung geben und eine Pull -Anfrage beibehalten.

Credits

Vielen Dank an Brandon Roberts und Marcos Huerta für ihre Hilfe und Ermutigung durch die Extraktion von Positionstext.

Expandieren

Zusätzliche Informationen

Version v0.2.1
Typ Anderer Quellcode
Aktualisierungszeit 2025-05-09
Größe 2.05MB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

textra

Textra

Installation

Verwendung

Optionen

Ausgabeoptionen

Beispiele

Anweisungen

Fehlerbehebung

Lizenz

Beiträge

Credits

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express