Interacción de voz perfecta y en tiempo real con IA.
Sugerencia: cualquiera que esté interesada en soluciones de voz de última generación, también eche un vistazo a Linguflex . Le permite controlar su entorno hablando y es uno de los asistentes de código abierto más capaces y sofisticados actualmente disponibles.
Utiliza la transmisión de entrada FASTER_WHISPER y ELEVENLABS para respuestas de baja latencia a la entrada hablada.
? Mira un video de demostración
Nota : La demostración se realiza en una conexión de 10 mbit/S, por lo que el rendimiento real podría ser más impresionante en conexiones más rápidas.
voice_talk_vad.py : detecta automáticamente el habla
voice_talk.py - Activa la grabación/apagado con la barra espaciadora
Reemplace your_openai_key y your_elevenlabs_key con sus valores de clave de la API OpenAI y ElevenLabs en el código.
Instale las bibliotecas de Python requeridas:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch Ejecute el script principal en función de su preferencia de modo:
python voice_talk_vad.pyo
python voice_talk.pyvoice_talk_vad.py : Habla con tu micrófono.
Escuche la respuesta.
voice_talk.py :Siéntase libre de bifurcar, mejorar y enviar solicitudes de extracción. Si está considerando cambios o adiciones significativas, comience abriendo un problema.
Gran agradecimiento a: