openai whisper realtime
1.0.0
これは、ささやきを使用してほぼリアルタイムの転写を実現するための簡単な実験です。
要件をインストールします:
pip install -r requirements.txt
スクリプトを実行します:
python openai-whisper-realtime.py
依存関係:
非常に高速なCPUまたはGPUが推奨されます。
システムのデフォルトのオーディオ入力は、Pythonでキャプチャされ、小さなチャンクに分割され、Openaiの元の転写関数に供給されます。 (現在はむしろ貧弱に)単語の破損を検出しようとし、そのような場合にはオーディオバッファーを分割しません。モデルの設計方法により、これを行うのは最も意味がありませんが、試してみる価値があることがわかりました。それは許容できるほどうまく機能します。