openai whisper realtime
1.0.0
Este é um experimento rápido para obter uma transcrição quase em tempo real usando o Whisper.
Instale os requisitos:
pip install -r requirements.txt
Execute o script:
python openai-whisper-realtime.py
Dependências:
Recomenda -se uma CPU ou GPU muito rápida.
A entrada de áudio padrão dos sistemas é capturada com Python, dividida em pequenos pedaços e depois é alimentada à função de transcrição original do OpenAI. Ele tenta (atualmente bastante mal) detectar quebras de palavras e não divide o buffer de áudio nesses casos. Com como o modelo é projetado, não faz mais sentido fazer isso, mas achei que valeria a pena tentar. Funciona aceitavelmente bem.