Download textra - Download do código -fonte textra

textra

Outro código-fonte

v0.2.1

Baixar

Textra

Um aplicativo de linha de comando para extrair texto de imagens, PDFs e arquivos de áudio usando as APIs de visão e fala da Apple.

Instalação

O Textra exige o Mac OS versão 13 ou maior para acessar as mais recentes APIs do VisionKit.

A maneira mais fácil de instalar textra é abrir uma janela do terminal e executar o seguinte comando:

curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash

Como alternativa, faça o download do lançamento mais recente, descompacte -o e coloque o textra executável em algum lugar no seu $PATH .

Uso

textra [options] FILE1 [FILE2...] [outputOptions]

Opções

-h , --help : mostre ajuda avançada

-s , --silent : suprimir a saída não essencial

-l , --locale : Especifique um local (por exemplo, EN-US) para reconhecimento de texto

-v , --version : mostre o número da versão

Opções de saída

-x , --outputStdout : Saia tudo para stdout (padrão)

-o , --outputText : Saia tudo para um único arquivo de texto

-t , --outputPageText : Saia cada arquivo/página para um arquivo de texto

-p , --outputPositions : Saída de texto posicional para cada arquivo/página para JSON (Experimental; resultados podem diferir do texto da página)

Exemplos

textra audio.mp3 : Extrair o texto de "Audio.mp3" e saída para stdout

textra page1.png page2.png -o combined.txt : Extrair o texto de "Page1.png" e "Page2.png" e produza o texto combinado para "Combined.txt"

textra doc.pdf -o doc.txt -t doc/page-{}.txt : extraia texto de "doc.pdf" e saída em dois formatos: 1) texto combinado de todas as páginas armazenadas em "doc.txt" e 2) text de cada página extraída no padrão "Page/página", "". etc.)

textra image1.png -o text1.txt image2.png -o text2.txt : extrair texto de "image1.png" e saída em "text1.txt"; Extraia o texto de "Image2.png" e a saída em "text2.txt"

textra image.png --outputPositions positionalText.json : extrair texto posicional de "image.png" e saída em "posicionaltext.json"

Instruções

Para usar textra , você deve fornecer pelo menos um arquivo de entrada.

textra extrairá todo o texto dos arquivos de imagem/pdf/áudio de entrada. Por padrão, textra imprimirá a saída para STDOUT, onde pode ser visualizada ou canalizada para outro programa.

Você pode usar as opções de saída acima em qualquer momento para extrair os arquivos especificados para disco em vários formatos. Por exemplo, textra doc.png -o page.txt -p page.json Extrairá "doc.png" em dois formatos: como texto da página para "Page.txt" e como texto posicional para "Page.json".

Você pode pontuar as cadeias de insumos com opções de saída para controlar finamente onde vários documentos extraídos terminarão. Por exemplo, textra doc.png -o image.txt speech.mp3 -o audio.txt Extrairá "doc.png" para "image.txt" e "discurso.mp3" para "audio.txt", respectivamente.

Para opções de saída que gravam em cada página ( -t , -p ), textra permite um caminho de saída que contém aparelhos encaracolados {} . Esses aparelhos serão substituídos por números de página no caso de um arquivo PDF, nomes de arquivos base no caso de arquivos de imagem ou baseFileName-pageNumber no caso de vários arquivos PDF. Sem especificar os aparelhos, o Textra anexará um traço seguido pelo nome do número/base da página no caminho do caminho especificado.

Solução de problemas

ERROR: Speech recognizer does not support on-device recognition :
Se você receber esse erro, poderá precisar do ditado ativado, o que você pode realizar nas configurações do sistema -> teclado -> ditado -> Ativar ditado .
O lançamento da configuração de ditado pode não corrigir imediatamente o erro. Se textra ainda fornecer esse erro ou se você não puder alternar a configuração, tente clicar no item de menu "editar" na barra de menu superior quando estiver em um aplicativo (por exemplo, terminal) e clicando em "Start Ditation". Isso pode solicitar que você ative o "ditado" novamente, e um prompt de microfone pode aparecer (que você pode descartar imediatamente clicando em "feito").
Experimente textra novamente. Se funcionar, você poderá desativar com segurança o ditado a qualquer momento nas configurações do sistema. Caso contrário, registre um problema.

Licença

Mit

Contribuições

Este repositório está em estágios iniciais, mas as contribuições são bem -vindas. Envie um problema ou fique à vontade para bifurcar e contribuir com uma solicitação de tração.

Créditos

Muito obrigado a Brandon Roberts e Marcos Huerta por sua ajuda e incentivo com a extração de texto posicional.

Expandir

Informações adicionais

Versão v0.2.1
Tipo Outro código-fonte
Data da Última Atualização 2025-05-09
tamanho 2.05MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos