livewhisper.py Выходы PSUedo-Live-Live-Deventer Dictation к терминалу. Использование Whisper Model Openai и библиотеки SoundDevice для прослушивания микрофона. Аудио с микрофона сохраняется, если он достигает порога объема и частоты, то когда молчание обнаруживается, он сохраняет звук в временном файле и отправляет его шепотом.
Зависимости: Whisper, Numpy, Scipy, SoundDevice
Живой Whatsper может несколько работать в качестве альтернативы речевому признанию. Хотя теперь у вас есть собственная поддержка шепота, так что это зависит от вас. ;)
Я также включил assistant.py , который использует LiveWhisper в качестве базы, является моей попыткой сделать простой помощник по голосовым командам, такого как Siri, Alexa или Jarvis.
Те же зависимости, что и LiveWhisper, а также запросы, Pyttsx3, Wikipedia, BS4. Также нуждаются: Espeak и Python3-Epeak.
Голосовой помощник может быть активирован, сказав, что это имя, по умолчанию «Компьютер», «Эй, компьютер» или «хорошо компьютер». Вы можете подождать, пока компьютер ответит или немедленно запросить действие/вопрос без приостановки.
Доступные функции: Погода, дата и время, расскажите шутки и поиск в Википедии. Он также может обрабатывать некоторые другие запросы, такие как базовая математика или настоящие простые мелочи. То, что полагается на фрагменты Google мгновенного ответа и иногда не работает.
Контрольные медиа-игроки, использующие: играть, сделать паузу, следующий, предыдущий, остановка, что играет? Управление для носителя требуется некоторая форма отмены шума/эхо, включенная в правильную работу. Смотрите эту страницу для получения дополнительной информации о том, как включить это в Linux Pulseaudio.
Вы можете закрыть помощника через ctrl+c или, сказав, что его имя и "прекращение".
Если вам нравятся мои проекты и вы хотите помочь мне продолжать делать больше, пожалуйста, подумайте о пожертвовании на моей странице KO-Fi! Спасибо!