Une application de ligne de commande pour extraire du texte des images, des PDF et des fichiers audio à l'aide des API de vision et de discours d'Apple.
![Une fenêtre de terminal montrant le texte: | % Textra The-Mueller-Report.pdf -o Report.txt | Conversion: | - Entrée (448 PG) The-Mueller-Report.pdf | - Sortie Rapport en texte intégral.txt | | 16 sur 448 [-] ETA: 00:05:21 (à 1,34 it / s)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra nécessite Mac OS version 13 ou plus pour accéder aux dernières API VisionKit.
La façon la plus simple d'installer textra est d'ouvrir une fenêtre de terminal et d'exécuter la commande suivante:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash Alternativement, téléchargez la dernière version, dézippez-la et placez l'exécutable textra quelque part sur votre $PATH .
textra [options] FILE1 [FILE2...] [outputOptions] -h , --help : montrez une aide avancée
-s , --silent : supprimer la sortie non essentielle
-l , --locale : spécifiez un paramètre régional (par exemple En-US) pour la reconnaissance de texte
-v , --version : montrez le numéro de version
-x , --outputStdout : Sortie de tout sur stdout (par défaut)
-o , --outputText : Tirez tout en un seul fichier texte
-t , --outputPageText : Sortie à chaque fichier / page dans un fichier texte
-p , --outputPositions : Sortie du texte de positionnt pour chaque fichier / page à JSON (expérimental; les résultats peuvent différer du texte de la page)
textra audio.mp3 : Extraire le texte de "Audio.mp3" et sortie sur stdout
textra page1.png page2.png -o combined.txt : extraire le texte de "page1.png" et "page2.png" et publiez le texte combiné à "combiné.txt"
textra doc.pdf -o doc.txt -t doc/page-{}.txt : extraire le texte de "doc.pdf" et sortie en deux formats: 1) Texte combiné de toutes les pages stockées dans "doc.txt" et 2) Texte de position à partir de chaque page extraite sur le modèle "Doc / Page - {}. Txt" (EG "Doc / Page etc.)
textra image1.png -o text1.txt image2.png -o text2.txt : extraire du texte de "image1.png" et sortie sur "text1.txt"; Extraire du texte de "image2.png" et sortie sur "text2.txt"
textra image.png --outputPositions positionalText.json : extraire le texte positionnel de "image.png" et sortie sur "PositionalText.json"
Pour utiliser textra , vous devez fournir au moins un fichier d'entrée.
textra extraire ensuite tout le texte des fichiers Image / PDF / Audio entrés. Par défaut, textra imprimera la sortie sur STDOUT, où elle peut être visionnée ou tuée dans un autre programme.
Vous pouvez utiliser les options de sortie ci-dessus à tout moment pour extraire les fichiers spécifiés sur disque dans divers formats. Par exemple, textra doc.png -o page.txt -p page.json extraire "doc.png" en deux formats: en tant que texte de page à "page.txt" et en tant que texte positionnel à "page.json".
Vous pouvez ponctuer des chaînes d'entrées avec des options de sortie pour contrôler finement où plusieurs documents extraits finiront. Par exemple, textra doc.png -o image.txt speech.mp3 -o audio.txt extraire "doc.png" à "image.txt" et "speech.mp3" à "audio.txt" respectivement.
Pour les options de sortie qui écrivent sur chaque page ( -t , -p ), textra permet un chemin de sortie qui contient des accolades bouclées {} . Ces accolades seront substituées par des numéros de page dans le cas d'un fichier PDF, des noms de fichiers de base dans le cas des fichiers d'image ou baseFileName-pageNumber dans le cas de plusieurs fichiers PDF. Sans spécifier les accolades, Textra ajoutera un tableau de bord suivi du numéro de numéro de page / du fichier de base sur le chemin spécifié.
ERROR: Speech recognizer does not support on-device recognition :
Si vous obtenez cette erreur, vous devrez peut-être activer la dictée, ce que vous pouvez accomplir dans les paramètres du système -> clavier -> dictée -> Activer la dictée .
Le retournement du paramètre de dictée peut ne pas réparer immédiatement l'erreur. Si textra fournit toujours cette erreur ou si vous ne pouvez pas basculer le paramètre, essayez de cliquer sur l'élément de menu "Modifier" dans la barre de menu supérieure lorsque vous êtes dans une application (par exemple terminal) et cliquez sur "Démarrer la dictée". Cela peut vous inviter à permettre à nouveau la "dictée", et une invite de microphone peut apparaître (que vous pouvez immédiatement rejeter en cliquant sur "Done").
Essayez à nouveau textra . Si cela fonctionne, vous pouvez désactiver en toute sécurité la dictée à tout moment dans les paramètres du système. Si ce n'est pas le cas, veuillez déposer un problème.
Mit
Ce repo est en début de stades, mais les contributions sont les bienvenues. Veuillez soumettre un problème ou n'hésitez pas à fourrer et à contribuer une demande de traction.
Un grand merci à Brandon Roberts et Marcos Huerta pour leur aide et leur encouragement avec l'extraction de texte positionnel.