livewhisper.py produz ditado de sentença por frase por frase ao terminal. Usando o modelo Whisper do OpenAI e a biblioteca SoundDevice para ouvir o microfone. O áudio do MIC é armazenado se atingir um limite de volume e frequência; então, quando o silêncio é detectado, salva o áudio em um arquivo temp e o envia para sussurrar.
Dependências: Whisper, Numpy, Scipy, SoundDevice
Livewhisper pode um pouco funcionar como uma alternativa à reconhecimento de discursos. Embora isso agora tenha seu próprio suporte de sussurro, então depende de você. ;)
Também incluí assistant.py , que usando o LiveWhisper como base, é minha tentativa de fazer um simples assistente de comando de voz como Siri, Alexa ou Jarvis.
As mesmas dependências que LiveWhisper, bem como solicitações, Pyttsx3, Wikipedia, BS4. Também precisa: Espeak e Python3-Esperek.
O assistente de voz pode ser ativado dizendo que é o nome, padrão "computador", "hey computador" ou "computador ok" também funcionam. Você pode esperar o computador responder ou solicitar imediatamente uma ação/pergunta sem fazer uma pausa.
Recursos disponíveis: clima, data e hora, Tell piadas e pesquisas da Wikipedia. Também pode lidar com outras solicitações, como matemática básica ou curiosidades simples. Isso depende dos trechos de resposta instantânea do Google e às vezes não funciona.
Controle os jogadores de mídia usando: brincar, pausar, próximo, anterior, parar, o que está tocando? Os controles de mídia precisam de algum tipo de cancelamento de ruído/eco habilitado para funcionar corretamente. Consulte esta página para obter mais informações sobre como ativar isso no Linux Pulseaudio.
Você pode fechar o assistente via ctrl+c , ou dizendo que é o nome e "encerrar".
Se você gosta dos meus projetos e deseja me ajudar a continuar fazendo mais, considere doar na minha página Ko-Fi! Obrigado!