Um aplicativo de linha de comando para extrair texto de imagens, PDFs e arquivos de áudio usando as APIs de visão e fala da Apple.
![Uma janela do terminal mostrando o texto: | % textra the-mueller-report.pdf -o report.txt | Conversão: | -Entrada (448 pg) the-mueller-report.pdf | - Saída Relatório de texto completo.txt | | 16 de 448 [-] eta: 00:05:21 (a 1,34 IT/s)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
O Textra exige o Mac OS versão 13 ou maior para acessar as mais recentes APIs do VisionKit.
A maneira mais fácil de instalar textra é abrir uma janela do terminal e executar o seguinte comando:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash Como alternativa, faça o download do lançamento mais recente, descompacte -o e coloque o textra executável em algum lugar no seu $PATH .
textra [options] FILE1 [FILE2...] [outputOptions] -h , --help : mostre ajuda avançada
-s , --silent : suprimir a saída não essencial
-l , --locale : Especifique um local (por exemplo, EN-US) para reconhecimento de texto
-v , --version : mostre o número da versão
-x , --outputStdout : Saia tudo para stdout (padrão)
-o , --outputText : Saia tudo para um único arquivo de texto
-t , --outputPageText : Saia cada arquivo/página para um arquivo de texto
-p , --outputPositions : Saída de texto posicional para cada arquivo/página para JSON (Experimental; resultados podem diferir do texto da página)
textra audio.mp3 : Extrair o texto de "Audio.mp3" e saída para stdout
textra page1.png page2.png -o combined.txt : Extrair o texto de "Page1.png" e "Page2.png" e produza o texto combinado para "Combined.txt"
textra doc.pdf -o doc.txt -t doc/page-{}.txt : extraia texto de "doc.pdf" e saída em dois formatos: 1) texto combinado de todas as páginas armazenadas em "doc.txt" e 2) text de cada página extraída no padrão "Page/página", "". etc.)
textra image1.png -o text1.txt image2.png -o text2.txt : extrair texto de "image1.png" e saída em "text1.txt"; Extraia o texto de "Image2.png" e a saída em "text2.txt"
textra image.png --outputPositions positionalText.json : extrair texto posicional de "image.png" e saída em "posicionaltext.json"
Para usar textra , você deve fornecer pelo menos um arquivo de entrada.
textra extrairá todo o texto dos arquivos de imagem/pdf/áudio de entrada. Por padrão, textra imprimirá a saída para STDOUT, onde pode ser visualizada ou canalizada para outro programa.
Você pode usar as opções de saída acima em qualquer momento para extrair os arquivos especificados para disco em vários formatos. Por exemplo, textra doc.png -o page.txt -p page.json Extrairá "doc.png" em dois formatos: como texto da página para "Page.txt" e como texto posicional para "Page.json".
Você pode pontuar as cadeias de insumos com opções de saída para controlar finamente onde vários documentos extraídos terminarão. Por exemplo, textra doc.png -o image.txt speech.mp3 -o audio.txt Extrairá "doc.png" para "image.txt" e "discurso.mp3" para "audio.txt", respectivamente.
Para opções de saída que gravam em cada página ( -t , -p ), textra permite um caminho de saída que contém aparelhos encaracolados {} . Esses aparelhos serão substituídos por números de página no caso de um arquivo PDF, nomes de arquivos base no caso de arquivos de imagem ou baseFileName-pageNumber no caso de vários arquivos PDF. Sem especificar os aparelhos, o Textra anexará um traço seguido pelo nome do número/base da página no caminho do caminho especificado.
ERROR: Speech recognizer does not support on-device recognition :
Se você receber esse erro, poderá precisar do ditado ativado, o que você pode realizar nas configurações do sistema -> teclado -> ditado -> Ativar ditado .
O lançamento da configuração de ditado pode não corrigir imediatamente o erro. Se textra ainda fornecer esse erro ou se você não puder alternar a configuração, tente clicar no item de menu "editar" na barra de menu superior quando estiver em um aplicativo (por exemplo, terminal) e clicando em "Start Ditation". Isso pode solicitar que você ative o "ditado" novamente, e um prompt de microfone pode aparecer (que você pode descartar imediatamente clicando em "feito").
Experimente textra novamente. Se funcionar, você poderá desativar com segurança o ditado a qualquer momento nas configurações do sistema. Caso contrário, registre um problema.
Mit
Este repositório está em estágios iniciais, mas as contribuições são bem -vindas. Envie um problema ou fique à vontade para bifurcar e contribuir com uma solicitação de tração.
Muito obrigado a Brandon Roberts e Marcos Huerta por sua ajuda e incentivo com a extração de texto posicional.