scribe
1.0.0
Scribe是一個Python腳本,它使用OpenAi Whisper轉錄音頻文件,並將轉錄作為PDF文檔導出,並通過GPT-3.5-Turbo API增強。它支持MP3,M4A和MP4文件格式作為輸入,並在A4大小頁面上格式化的轉錄文本生成了PDF文件。該腳本還利用OpenAI的GPT-3.5-Turbo模型來生成轉錄標題。
功能將MP3,M4A和MP4文件轉換為wav格式,用於轉錄轉錄音頻文件,使用Whisper ASR模型使用OpenAI的GPT-3.5-Turbo模型為轉錄生成標題,創建一個PDF文件,並在A4尺寸的PAGE上格式化的轉錄文本,包括PDF輸出的樣式,包括文本Alignment和Font Alignment size size的樣式,
用法:python scribev4.py <input_file>
將<input_file>替換為MP3,M4A或MP4文件的路徑。
該腳本將抄錄音頻文件,生成標題,並與具有相同名稱但.pdf擴展名的輸入文件相同的目錄中創建一個PDF文件。
先決條件:
安裝耳語:pip安裝git+https://github.com/openai/whisper.git
查看其他可用的預培訓模型及其在Whisper的Github上的性能:https://github.com/openai/whisper
安裝其他依賴性:Pydub Openai Reportlab theypy
Diet Scribe使用OpenAI API並輸出TXT。
設置API鍵
安裝所有必需的依賴項:pydub,hightpy,openai
運行:Python Diet-scribe.py <input_file>