中文
Base em Whisper e Pyqt (Pyside6), uma ferramenta de bate -papo de voz em tempo real, apoiando conversas históricas. Desfrute de conversar com a voz GPT sem confiar no ChatGpt Plus. ?
Python> = 3.10
Win10+, Linux (basta testar no Ubuntu, obras), Mac (baseado no Linux como referência, teoricamente viável, mas não testado.)
A execução do whisper base model requer menos de 1 GB de memória disponível, e os resultados são aceitáveis sem ruído e uma taxa de precisão em torno de 90% em situações precisas de idioma falado. O whisper large model requer mais de 8 GB de memória disponível, mas oferece excelente desempenho. Até minhas pobres habilidades de falar em inglês são reconhecidas com bastante precisão. Além disso, lida com segmentos e interrupções longos de fala com bastante eficácia.
Em resumo, o modelo básico é mais fácil de usar, mas se as condições permitirem, é recomendável usar o modelo grande. Nos casos de erros de reconhecimento, as modificações podem ser feitas diretamente nos resultados reconhecidos na GUI.
Repo Clone
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoiceCrie e ativar um ambiente virtual. (PowerShell. Em Bash, pode ser necessário executar scripts como o Activate.)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1Instalar dependências.
pip install -r requirements.txtNo Linux, você precisa executar o seguinte comando para instalar as dependências necessárias.
apt install portaudio19-dev python3-pyaudio
apt install espeakExecutar diretamente dentro do Env virtual.
python ./main.py
Eu tenho um host Linux com 12 GB de memória GPU e um laptop com uma GPU de 1650 fracos. Para executar o modelo Whisper Large, você pode hospedar o Whisper no Linux e usar a comunicação do WebSocket entre o cliente e o sussurro.
Linux:
python scrpit/whisper_server.py --model large-v2
cliente:
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809Depois de ativar o proxy, todas as solicitações e downloads de modelos do OpenAI GPT passarão pelo nó proxy.
Pyqt-Fluent-Widgets Uma biblioteca de widgets de design fluente baseado em pyqt5