Téléchargement textra - Téléchargement du code source textra

textra

Autre code source

v0.2.1

Télécharger

textra

Une application de ligne de commande pour extraire du texte des images, des PDF et des fichiers audio à l'aide des API de vision et de discours d'Apple.

Installation

Textra nécessite Mac OS version 13 ou plus pour accéder aux dernières API VisionKit.

La façon la plus simple d'installer textra est d'ouvrir une fenêtre de terminal et d'exécuter la commande suivante:

curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash

Alternativement, téléchargez la dernière version, dézippez-la et placez l'exécutable textra quelque part sur votre $PATH .

Usage

textra [options] FILE1 [FILE2...] [outputOptions]

Options

-h , --help : montrez une aide avancée

-s , --silent : supprimer la sortie non essentielle

-l , --locale : spécifiez un paramètre régional (par exemple En-US) pour la reconnaissance de texte

-v , --version : montrez le numéro de version

Options de sortie

-x , --outputStdout : Sortie de tout sur stdout (par défaut)

-o , --outputText : Tirez tout en un seul fichier texte

-t , --outputPageText : Sortie à chaque fichier / page dans un fichier texte

-p , --outputPositions : Sortie du texte de positionnt pour chaque fichier / page à JSON (expérimental; les résultats peuvent différer du texte de la page)

Exemples

textra audio.mp3 : Extraire le texte de "Audio.mp3" et sortie sur stdout

textra page1.png page2.png -o combined.txt : extraire le texte de "page1.png" et "page2.png" et publiez le texte combiné à "combiné.txt"

textra doc.pdf -o doc.txt -t doc/page-{}.txt : extraire le texte de "doc.pdf" et sortie en deux formats: 1) Texte combiné de toutes les pages stockées dans "doc.txt" et 2) Texte de position à partir de chaque page extraite sur le modèle "Doc / Page - {}. Txt" (EG "Doc / Page etc.)

textra image1.png -o text1.txt image2.png -o text2.txt : extraire du texte de "image1.png" et sortie sur "text1.txt"; Extraire du texte de "image2.png" et sortie sur "text2.txt"

textra image.png --outputPositions positionalText.json : extraire le texte positionnel de "image.png" et sortie sur "PositionalText.json"

Instructions

Pour utiliser textra , vous devez fournir au moins un fichier d'entrée.

textra extraire ensuite tout le texte des fichiers Image / PDF / Audio entrés. Par défaut, textra imprimera la sortie sur STDOUT, où elle peut être visionnée ou tuée dans un autre programme.

Vous pouvez utiliser les options de sortie ci-dessus à tout moment pour extraire les fichiers spécifiés sur disque dans divers formats. Par exemple, textra doc.png -o page.txt -p page.json extraire "doc.png" en deux formats: en tant que texte de page à "page.txt" et en tant que texte positionnel à "page.json".

Vous pouvez ponctuer des chaînes d'entrées avec des options de sortie pour contrôler finement où plusieurs documents extraits finiront. Par exemple, textra doc.png -o image.txt speech.mp3 -o audio.txt extraire "doc.png" à "image.txt" et "speech.mp3" à "audio.txt" respectivement.

Pour les options de sortie qui écrivent sur chaque page ( -t , -p ), textra permet un chemin de sortie qui contient des accolades bouclées {} . Ces accolades seront substituées par des numéros de page dans le cas d'un fichier PDF, des noms de fichiers de base dans le cas des fichiers d'image ou baseFileName-pageNumber dans le cas de plusieurs fichiers PDF. Sans spécifier les accolades, Textra ajoutera un tableau de bord suivi du numéro de numéro de page / du fichier de base sur le chemin spécifié.

Dépannage

ERROR: Speech recognizer does not support on-device recognition :
Si vous obtenez cette erreur, vous devrez peut-être activer la dictée, ce que vous pouvez accomplir dans les paramètres du système -> clavier -> dictée -> Activer la dictée .
Le retournement du paramètre de dictée peut ne pas réparer immédiatement l'erreur. Si textra fournit toujours cette erreur ou si vous ne pouvez pas basculer le paramètre, essayez de cliquer sur l'élément de menu "Modifier" dans la barre de menu supérieure lorsque vous êtes dans une application (par exemple terminal) et cliquez sur "Démarrer la dictée". Cela peut vous inviter à permettre à nouveau la "dictée", et une invite de microphone peut apparaître (que vous pouvez immédiatement rejeter en cliquant sur "Done").
Essayez à nouveau textra . Si cela fonctionne, vous pouvez désactiver en toute sécurité la dictée à tout moment dans les paramètres du système. Si ce n'est pas le cas, veuillez déposer un problème.

Licence

Mit

Contributions

Ce repo est en début de stades, mais les contributions sont les bienvenues. Veuillez soumettre un problème ou n'hésitez pas à fourrer et à contribuer une demande de traction.

Crédits

Un grand merci à Brandon Roberts et Marcos Huerta pour leur aide et leur encouragement avec l'extraction de texte positionnel.

Développer

Informations supplémentaires

Version v0.2.1
Type Autre code source
Date de mise à jour 2025-05-09
taille 2.05MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout