Scribe는 Openai Whisper를 사용하여 오디오 파일을 전사하고 GPT-3.5-Turbo API에 의해 향상된 PDF 문서로 전사를 내보내는 Python 스크립트입니다. MP3, M4A 및 MP4 파일 형식을 입력으로 지원하고 A4 크기 페이지에 형식화 된 전사 텍스트가있는 PDF 파일을 생성합니다. 이 스크립트는 또한 OpenAI의 GPT-3.5-Turbo 모델을 사용하여 전사 제목을 생성합니다.
특징은 MP3, M4A 및 MP4 파일을 전사 전사에 대한 WAV 형식으로 변환합니다. Whisper ASR 모델을 사용하여 OpenAi의 GPT-3.5-Turbo 모델을 사용하여 전사 제목을 생성합니다.
사용법 : Python scribev4.py <input_file>
<input_file>을 MP3, M4A 또는 MP4 파일로가는 경로로 바꾸십시오.
스크립트는 오디오 파일을 전사하고, 제목을 생성하며, 이름이 동일한 입력 파일과 동일한 디렉토리에서 .pdf 확장자를 만듭니다.
사전 반품 :
Whisper 설치 : PIP 설치 git+https : //github.com/openai/whisper.git
Whisper 's Github : https://github.com/openai/whisper에 대한 다양한 미리 훈련 된 모델과 성능을 확인하십시오.
다른 종속성을 설치하십시오 : Pydub OpenAi ReportLab Moviepy
Diet Scribe는 OpenAI API를 사용하고 TXT를 출력합니다.
API 키를 설정하십시오
Pydub, Moviepy, OpenAi와 같은 모든 필요한 종속성을 설치하십시오
실행 : Python diet-scribe.py <input_file>