scribe
1.0.0
Scribe是一个Python脚本,它使用OpenAi Whisper转录音频文件,并将转录作为PDF文档导出,并通过GPT-3.5-Turbo API增强。它支持MP3,M4A和MP4文件格式作为输入,并在A4大小页面上格式化的转录文本生成了PDF文件。该脚本还利用OpenAI的GPT-3.5-Turbo模型来生成转录标题。
功能将MP3,M4A和MP4文件转换为wav格式,用于转录转录音频文件,使用Whisper ASR模型使用OpenAI的GPT-3.5-Turbo模型为转录生成标题,创建一个PDF文件,并在A4尺寸的PAGE上格式化的转录文本,包括PDF输出的样式,包括文本Alignment和Font Alignment size size的样式,
用法:python scribev4.py <input_file>
将<input_file>替换为MP3,M4A或MP4文件的路径。
该脚本将抄录音频文件,生成标题,并与具有相同名称但.pdf扩展名的输入文件相同的目录中创建一个PDF文件。
先决条件:
安装耳语:pip安装git+https://github.com/openai/whisper.git
查看其他可用的预培训模型及其在Whisper的Github上的性能:https://github.com/openai/whisper
安装其他依赖性:Pydub Openai Reportlab theypy
Diet Scribe使用OpenAI API并输出TXT。
设置API键
安装所有必需的依赖项:pydub,hightpy,openai
运行:Python Diet-scribe.py <input_file>