Interação de voz perfeita e em tempo real com a IA.
Dica: qualquer pessoa interessada em soluções de voz de última geração, também dê uma olhada no Linguflex . Ele permite controlar seu ambiente falando e é um dos assistentes de código aberto mais capazes e sofisticados atualmente disponíveis.
Usa a entrada de entrada mais rápida e elevina para respostas de baixa latência à entrada falada.
? Assista a um vídeo de demonstração
Nota : A demonstração é realizada em uma conexão de 10Mbit/s, portanto, o desempenho real pode ser mais impressionante em conexões mais rápidas.
voice_talk_vad.py - detecta automaticamente a fala
voice_talk.py - ATRAVENDO A REGISTING ON/OFF com a barra de espaço
Substitua your_openai_key e your_elevenlabs_key com seus valores -chave da API OpenAi e Elevenlabs no código.
Instale as bibliotecas Python necessárias:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch Execute o script principal com base na sua preferência de modo:
python voice_talk_vad.pyou
python voice_talk.pyvoice_talk_vad.py : Fale com o seu microfone.
Ouça a resposta.
voice_talk.py :Sinta -se à vontade para bifurcar, melhorar e enviar solicitações de tração. Se você está pensando em alterações ou adições significativas, comece abrindo um problema.
Enorme grito para: