openai whisper realtime
1.0.0
这是一个快速的实验,可以使用耳语实现几乎实时转录。
安装要求:
pip install -r requirements.txt
运行脚本:
python openai-whisper-realtime.py
依赖性:
建议使用非常快的CPU或GPU。
系统默认的音频输入被Python捕获,分为小块,然后将其馈送到OpenAI的原始转录功能。它(目前相当糟糕)以检测单词断裂,并且在这些情况下不会拆分音频缓冲区。借助模型的设计,这样做并不是最有意义的,但是我发现值得尝试。它可以接受。