Apple의 비전 및 음성 API를 사용하여 이미지, PDF 및 오디오 파일에서 텍스트를 추출하는 명령 줄 애플리케이션.
![텍스트를 보여주는 터미널 창 : | % textra the-mueller-report.pdf -o report.txt | 변환 : | -입력 (448 pg) the-mueller-report.pdf | - 전체 텍스트 보고서를 출력합니다 .txt | | 16 of 448 [-] ETA : 00:05:21 (1.34 IT/S)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
Textra는 최신 VisionKit API에 액세스하려면 Mac OS 버전 13 이상이 필요합니다.
textra 설치하는 가장 쉬운 방법은 터미널 창을 열고 다음 명령을 실행하는 것입니다.
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash 또는 최신 릴리스를 다운로드하여 압축을 풀고 textra 실행 파일을 $PATH 어딘가에 배치하십시오.
textra [options] FILE1 [FILE2...] [outputOptions] -h , --help : 고급 도움말을 보여줍니다
-s , --silent : 필수적인 출력을 억제합니다
-l , --locale : 텍스트 인식을 위해 로케일 (예 : EN-US)을 지정합니다.
-v , --version : 버전 번호 표시
-x , --outputStdout : 모든 것을 stdout으로 출력 (기본값)
-o , --outputText : 모든 것을 단일 텍스트 파일로 출력
-t , --outputPageText : 각 파일/페이지를 텍스트 파일로 출력
-p , --outputPositions : 각 파일에 대한 출력 위치 텍스트/페이지에서 JSON (실험; 결과는 페이지 텍스트와 다를 수 있음)
textra audio.mp3 : "Audio.mp3"에서 텍스트를 추출하고 stdout으로 출력
textra page1.png page2.png -o combined.txt : "page1.png"및 "page2.png"에서 텍스트를 추출하고 결합 된 텍스트를 "combined.txt"로 출력합니다.
textra doc.pdf -o doc.txt -t doc/page-{}.txt : "doc.pdf"에서 텍스트를 추출하고 두 가지 형식으로 출력 : 1) "doc.txt"에 저장된 모든 페이지의 결합 된 텍스트와 2) "doc/page-{}."
textra image1.png -o text1.txt image2.png -o text2.txt : "image1.png"에서 텍스트를 추출하고 "text1.txt"에서 출력; "image2.png"에서 텍스트를 추출하고 "text2.txt"에서 출력
textra image.png --outputPositions positionalText.json : "image.png"에서 위치 텍스트를 추출하고 "positionaltext.json"에서 출력
textra 사용하려면 하나 이상의 입력 파일을 제공해야합니다.
그런 다음 textra 입력 된 이미지/PDF/오디오 파일에서 모든 텍스트를 추출합니다. 기본적으로 textra 출력을 STDOUT에 인쇄하여 다른 프로그램으로 보거나 배관 할 수 있습니다.
언제라도 위의 출력 옵션을 사용하여 지정된 파일을 다양한 형식으로 디스크로 추출 할 수 있습니다. 예를 들어, textra doc.png -o page.txt -p page.json "doc.png"가 "page.txt"로 페이지 텍스트로 "page.json"에 대한 위치 텍스트로 "doc.png"를 추출합니다.
출력 옵션을 사용하여 입력 체인을 구분하여 여러 추출 된 문서가 끝날 위치를 잘 제어 할 수 있습니다. 예를 들어, textra doc.png -o image.txt speech.mp3 -o audio.txt "doc.png"로 "image.txt"및 "speech.mp3"로 각각 "audio.txt"로 추출됩니다.
각 페이지 ( -t , -p )에 쓰는 출력 옵션의 경우 textra 곱슬 브레이스 {} 포함하는 출력 경로를 허용합니다. 이 버팀대는 PDF 파일의 경우 페이지 번호로 대체됩니다. 이미지 파일의 경우 기본 파일 이름 또는 여러 PDF 파일의 경우 baseFileName-pageNumber . 버팀대를 지정하지 않고 Textra는 대시와 페이지 번호/기본 파일 이름을 지정된 경로에 추가합니다.
ERROR: Speech recognizer does not support on-device recognition .
이 오류가 발생하면 시스템 설정 -> 키보드 -> 독재 -> 사용을 활성화 할 수있는 사용을 활성화해야 할 수도 있습니다.
받아 들여지는 설정을 뒤집어 놓으면 즉시 오류가 해결되지 않을 수 있습니다. textra 여전히이 오류를 제공하거나 설정을 전환 할 수없는 경우 응용 프로그램 (예 : 터미널)에있을 때 상단 메뉴 표시 줄에서 "편집"메뉴 항목을 클릭하고 "Dictation Start"를 클릭하십시오. 이렇게하면 "받아 들여진"이라는 메시지가 다시 표시 될 수 있으며 마이크 프롬프트가 나타날 수 있습니다 ( "완료"를 클릭하여 즉시 해고 할 수 있습니다).
textra 다시 시도하십시오. 작동하는 경우 시스템 설정에서 언제든지 사용을 안전하게 비활성화 할 수 있습니다. 그렇지 않은 경우 문제를 제출하십시오.
MIT
이 저장소는 초기 단계이지만 기부금을 환영합니다. 문제를 제출하거나 자유롭게 포크하고 풀 요청을 기부하십시오.
Brandon Roberts와 Marcos Huerta에게 포지션 텍스트 추출에 대한 도움과 격려에 감사드립니다.