Бесполезное и голосовое взаимодействие в реальном времени с ИИ.
Подсказка: любой, кто интересуется современными голосовыми решениями, также посмотрите на Linguflex . Он позволяет вам контролировать окружающую среду, выступая, и является одним из самых способных и сложных помощников с открытым исходным кодом.
Использует потоковую передачу ввода exper_whisper и elevenlabs для ответов на низкую задержку на разговорную вход.
? Посмотрите демо -видео
Примечание . Демонстрация проводится на 10 -метровом подключении, поэтому фактическая производительность может быть более впечатляющей при более быстрых соединениях.
voice_talk_vad.py - автоматически обнаруживает речь
voice_talk.py - переключение записи/выключение с космической панелью
Замените your_openai_key и your_elevenlabs_key на ваши значения ключа API OpenAI и ElevenLabs в коде.
Установите необходимые библиотеки Python:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch Выполните основной сценарий на основе предпочтения вашего режима:
python voice_talk_vad.pyили
python voice_talk.pyvoice_talk_vad.py : Поговорите в свой микрофон.
Слушайте ответ.
voice_talk.py :Не стесняйтесь разбираться, улучшать и отправлять запросы на привлечение. Если вы рассматриваете значительные изменения или дополнения, начните с открытия проблемы.
Огромный крик: