livewhisper.py sale Psuedo-Live oración por orientación Dicción a la terminal. Usando el modelo Whisper de OpenAI y la biblioteca SoundDevice para escuchar micrófono. El audio del micrófono se almacena si llega a un umbral de volumen y frecuencia, luego, cuando se detecta el silencio, guarda el audio a un archivo temporal y lo envía a susurrar.
Dependencias: Whisper, Numpy, Scipy, Sounddevice
Live Whisper puede funcionar de alguna manera como una alternativa al reconocimiento del habla. Aunque ahora tiene su propio apoyo de susurro, así que depende de usted. ;)
También he incluido assistant.py , que usar Live Whisper como base, es mi intento de hacer un asistente simple de comando de voz como Siri, Alexa o Jarvis.
Las mismas dependencias que Live Whisper, así como las solicitudes, PYTTSX3, Wikipedia, BS4. También necesita: Espeak y Python3-Expeak.
El asistente de voz puede activarse diciendo que es el nombre, la "computadora" predeterminada, "Hey Computer" o "Ok Beak Computer" también funciona. Puede esperar a que la computadora responda, o solicitar inmediatamente una acción/pregunta sin detenerse.
Características disponibles: Clima, Fecha y Hora, Tell Chistes y Do Wikipedia Búsquedas. También puede manejar algunas otras solicitudes, como matemáticas básicas o trivias simples reales. Tho eso se basa en los fragmentos de respuesta instantánea de Google y, a veces, no funciona.
Controle a los jugadores de medios que usan: Play, Pausa, Next, Anterior, Stop, ¿qué está jugando? Los controles de los medios necesitan alguna forma de ruido/cancelación de eco habilitada para funcionar bien. Consulte esta página para obtener más información sobre cómo habilitar eso en Linux PulseAudio.
Puede cerrar el asistente a través de ctrl+c , o diciendo que es nombre y "terminar".
Si te gustan mis proyectos y quieres ayudarme a seguir haciendo más, ¡considere donar en mi página de Ko-Fi! ¡Gracias!