中文
База на Whisper и Pyqt (Pyside6), инструмент чата в режиме реального времени, поддерживающий исторические разговоры. Наслаждайтесь общаться с голосом GPT, не полагаясь на Chatgpt Plus. ??
Python> = 3.10
Win10+, Linux (просто тестируйте в Ubuntu, Works), Mac (на основе Linux как ссылки, теоретически осуществимых, но не протестированных.)
Запуск whisper base model требует менее 1 ГБ доступной памяти, и результаты являются проходимыми без шума и скорости точности около 90% в точных ситуациях разговорного языка. whisper large model требует более 8 ГБ доступной памяти, но она обеспечивает отличную производительность. Даже мои плохие навыки говорящих на английском языке признаются довольно точно. Более того, он довольно эффективно обрабатывает длинные сегменты речи и перерывы.
Таким образом, базовая модель более удобна для пользователя, но если условия позволяют, рекомендуется использовать большую модель. В случаях ошибок распознавания могут быть непосредственно внесены модификации для признанных результатов в графическом интерфейсе.
Клон репо
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoiceСоздайте и активируйте виртуальную среду. (PowerShell. В Bash вам может потребоваться запустить сценарии, такие как Activate.)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1Установить зависимости.
pip install -r requirements.txtВ Linux вам нужно запустить следующую команду для установки требуемых зависимостей.
apt install portaudio19-dev python3-pyaudio
apt install espeakВыполнить непосредственно в виртуальной Env.
python ./main.py
У меня есть хост Linux с 12 ГБ памяти GPU и ноутбук со слабым GPU 1650. Чтобы запустить большую модель Whisper, вы можете размещать шепот на Linux и использовать связь WebSocket между клиентом и шепотом.
Linux :
python scrpit/whisper_server.py --model large-v2
Клиент :
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809После включения прокси, все запросы OpenAI GPT и загрузки моделей пройдут через прокси -узл.
Pyqt-Fluenter-Widgets Библиотека виджетов Fluent Design на основе Pyqt5