Una aplicación de línea de comandos para extraer texto de imágenes, PDF y archivos de audio utilizando las API de visión y del habla de Apple.
![Una ventana terminal que muestra el texto: | % Textra the-mueller-report.pdf -o report.txt | Convertir: | -Entrada (448 pg) The-Mueller-Report.pdf | - Salida Informe de texto completo.txt | | 16 de 448 [-] ETA: 00:05:21 (en 1.34 IT/s)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra requiere Mac OS versión 13 o mayor para acceder a las últimas API de VisionKit.
La forma más fácil de instalar textra es abrir una ventana de terminal y ejecutar el siguiente comando:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash Alternativamente, descargue el último lanzamiento, descomprima y coloque el ejecutable de textra en algún lugar de su $PATH .
textra [options] FILE1 [FILE2...] [outputOptions] -h , --help : mostrar ayuda avanzada
-s , --silent : suprimir la salida no esencial
-l , --locale : especifique una configuración regional (por ejemplo) para el reconocimiento de texto
-v , --version : mostrar el número de versión
-x , --outputStdout : emitir todo a stdout (predeterminado)
-o , --outputText : emitir todo a un solo archivo de texto
-t , --outputPageText : emitir cada archivo/página a un archivo de texto
-p , --outputPositions : texto de posición de salida para cada archivo/página a JSON (experimental; los resultados pueden diferir del texto de la página)
textra audio.mp3 : Extraiga el texto de "Audio.mp3" y salga a Stdout
textra page1.png page2.png -o combined.txt : extraiga el texto de "Page1.png" y "Page2.png" y emite el texto combinado a "combinado.txt"
textra doc.pdf -o doc.txt -t doc/page-{}.txt : extraer texto de "doc.pdf" y salida en dos formatos: 1) texto combinado de todas las páginas almacenadas en "doc.txt" y 2) texto posicional de cada página extraído en el patrón "Doc/página-{}. Txt" (EG "Doc/Page-1.txt", "Page, Doc.
textra image1.png -o text1.txt image2.png -o text2.txt : extraer texto de "image1.png" y salir en "text1.txt"; Extraiga texto de "Image2.png" y salga a "Text2.txt"
textra image.png --outputPositions positionalText.json : extraer texto posicional de "image.png" y salida en "posicionAlText.json"
Para usar textra , debe proporcionar al menos un archivo de entrada.
textra extraerá todo el texto de los archivos de imagen/PDF/audio de entrada. De manera predeterminada, textra imprimirá la salida a Stdout, donde se puede ver o canalizar en otro programa.
Puede usar las opciones de salida anteriores en cualquier punto para extraer los archivos especificados al disco en varios formatos. Por ejemplo, textra doc.png -o page.txt -p page.json extraerá "doc.png" en dos formatos: como texto de página a "page.txt" y como texto posicional a "Page.json".
Puede puntuar las cadenas de entradas con opciones de salida para controlar finamente donde terminarán múltiples documentos extraídos. Por ejemplo, textra doc.png -o image.txt speech.mp3 -o audio.txt extraerá "doc.png" a "image.txt" y "speace.mp3" a "audio.txt" respectivamente.
Para las opciones de salida que escriben en cada página ( -t , -p ), textra permite una ruta de salida que contiene aparatos {} . Estas aparatos ortopédicos se sustituirán con números de página en el caso de un archivo PDF, nombres de archivo base en el caso de archivos de imagen o baseFileName-pageNumber en el caso de múltiples archivos PDF. Sin especificar los aparatos ortopédicos, Textra agregará un tablero seguido del número de página/nombre de archivo base a la ruta especificada.
ERROR: Speech recognizer does not support on-device recognition :
Si recibe este error, es posible que necesite un dictado habilitado, que puede lograr en la configuración del sistema -> Teclado -> Dicción -> Habilitar dictado .
Voltear la configuración de dictado puede no corregir inmediatamente el error. Si textra todavía proporciona este error o si no puede alternar la configuración, intente hacer clic en el elemento de menú "Editar" en la barra de menú superior cuando esté en una aplicación (por ejemplo, terminal) y haga clic en "Iniciar dictado". Esto puede pedirle que habilite "dictado" nuevamente, y puede aparecer un mensaje de micrófono (que puede descartar inmediatamente haciendo clic en "Listo").
Prueba textra nuevamente. Si funciona, puede deshabilitar de forma segura en cualquier momento en la configuración del sistema. Si no es así, presente un problema.
MIT
Este repositorio se encuentra en las primeras etapas, pero las contribuciones son bienvenidas. Envíe un problema o no dude en el bifurcado y contribuya con una solicitud de extracción.
Muchas gracias a Brandon Roberts y Marcos Huerta por su ayuda y aliento con la extracción de texto posicional.