openai whisper realtime
1.0.0
Este es un experimento rápido para lograr una transcripción casi en tiempo real usando Whisper.
Instale los requisitos:
pip install -r requirements.txt
Ejecute el guión:
python openai-whisper-realtime.py
Dependencias:
Se recomienda una CPU o GPU muy rápida.
La entrada de audio predeterminada de los sistemas se captura con Python, se divide en pequeños fragmentos y luego se alimenta a la función de transcripción original de Openi. Intenta (actualmente bastante mal) detectar descansos de palabras y no divide el búfer de audio en esos casos. Con cómo está diseñado el modelo, no tiene más sentido hacer esto, pero descubrí que valdría la pena intentarlo. Funciona aceptablemente bien.