Descarga textra - Descargar el código fuente textra

textra

Otro código fuente

v0.2.1

Descargar

Textra

Una aplicación de línea de comandos para extraer texto de imágenes, PDF y archivos de audio utilizando las API de visión y del habla de Apple.

Instalación

Textra requiere Mac OS versión 13 o mayor para acceder a las últimas API de VisionKit.

La forma más fácil de instalar textra es abrir una ventana de terminal y ejecutar el siguiente comando:

curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash

Alternativamente, descargue el último lanzamiento, descomprima y coloque el ejecutable de textra en algún lugar de su $PATH .

Uso

textra [options] FILE1 [FILE2...] [outputOptions]

Opción

-h , --help : mostrar ayuda avanzada

-s , --silent : suprimir la salida no esencial

-l , --locale : especifique una configuración regional (por ejemplo) para el reconocimiento de texto

-v , --version : mostrar el número de versión

Opciones de salida

-x , --outputStdout : emitir todo a stdout (predeterminado)

-o , --outputText : emitir todo a un solo archivo de texto

-t , --outputPageText : emitir cada archivo/página a un archivo de texto

-p , --outputPositions : texto de posición de salida para cada archivo/página a JSON (experimental; los resultados pueden diferir del texto de la página)

Ejemplos

textra audio.mp3 : Extraiga el texto de "Audio.mp3" y salga a Stdout

textra page1.png page2.png -o combined.txt : extraiga el texto de "Page1.png" y "Page2.png" y emite el texto combinado a "combinado.txt"

textra doc.pdf -o doc.txt -t doc/page-{}.txt : extraer texto de "doc.pdf" y salida en dos formatos: 1) texto combinado de todas las páginas almacenadas en "doc.txt" y 2) texto posicional de cada página extraído en el patrón "Doc/página-{}. Txt" (EG "Doc/Page-1.txt", "Page, Doc.

textra image1.png -o text1.txt image2.png -o text2.txt : extraer texto de "image1.png" y salir en "text1.txt"; Extraiga texto de "Image2.png" y salga a "Text2.txt"

textra image.png --outputPositions positionalText.json : extraer texto posicional de "image.png" y salida en "posicionAlText.json"

Instrucciones

Para usar textra , debe proporcionar al menos un archivo de entrada.

textra extraerá todo el texto de los archivos de imagen/PDF/audio de entrada. De manera predeterminada, textra imprimirá la salida a Stdout, donde se puede ver o canalizar en otro programa.

Puede usar las opciones de salida anteriores en cualquier punto para extraer los archivos especificados al disco en varios formatos. Por ejemplo, textra doc.png -o page.txt -p page.json extraerá "doc.png" en dos formatos: como texto de página a "page.txt" y como texto posicional a "Page.json".

Puede puntuar las cadenas de entradas con opciones de salida para controlar finamente donde terminarán múltiples documentos extraídos. Por ejemplo, textra doc.png -o image.txt speech.mp3 -o audio.txt extraerá "doc.png" a "image.txt" y "speace.mp3" a "audio.txt" respectivamente.

Para las opciones de salida que escriben en cada página ( -t , -p ), textra permite una ruta de salida que contiene aparatos {} . Estas aparatos ortopédicos se sustituirán con números de página en el caso de un archivo PDF, nombres de archivo base en el caso de archivos de imagen o baseFileName-pageNumber en el caso de múltiples archivos PDF. Sin especificar los aparatos ortopédicos, Textra agregará un tablero seguido del número de página/nombre de archivo base a la ruta especificada.

Solución de problemas

ERROR: Speech recognizer does not support on-device recognition :
Si recibe este error, es posible que necesite un dictado habilitado, que puede lograr en la configuración del sistema -> Teclado -> Dicción -> Habilitar dictado .
Voltear la configuración de dictado puede no corregir inmediatamente el error. Si textra todavía proporciona este error o si no puede alternar la configuración, intente hacer clic en el elemento de menú "Editar" en la barra de menú superior cuando esté en una aplicación (por ejemplo, terminal) y haga clic en "Iniciar dictado". Esto puede pedirle que habilite "dictado" nuevamente, y puede aparecer un mensaje de micrófono (que puede descartar inmediatamente haciendo clic en "Listo").
Prueba textra nuevamente. Si funciona, puede deshabilitar de forma segura en cualquier momento en la configuración del sistema. Si no es así, presente un problema.

Licencia

MIT

Contribuciones

Este repositorio se encuentra en las primeras etapas, pero las contribuciones son bienvenidas. Envíe un problema o no dude en el bifurcado y contribuya con una solicitud de extracción.

Créditos

Muchas gracias a Brandon Roberts y Marcos Huerta por su ayuda y aliento con la extracción de texto posicional.

Expandir

Información adicional

Versión v0.2.1
Tipo Otro código fuente
Fecha de actualización 2025-05-09
tamaño 2.05MB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo