openai whisper realtime
1.0.0
這是一個快速的實驗,可以使用耳語實現幾乎實時轉錄。
安裝要求:
pip install -r requirements.txt
運行腳本:
python openai-whisper-realtime.py
依賴性:
建議使用非常快的CPU或GPU。
系統默認的音頻輸入被Python捕獲,分為小塊,然後將其饋送到OpenAI的原始轉錄功能。它(目前相當糟糕)以檢測單詞斷裂,並且在這些情況下不會拆分音頻緩衝區。借助模型的設計,這樣做並不是最有意義的,但是我發現值得嘗試。它可以接受。