中文
Base on Whisper et Pyqt (Pyside6), un outil de chat GPT vocal en temps réel, soutenant les conversations historiques. Profitez de discuter avec GPT Voice sans compter sur Chatgpt Plus. ??
Python> = 3.10
Win10 +, Linux (juste tester dans Ubuntu, Works), Mac (basé sur Linux comme référence, théoriquement possible, mais pas testé.)
L'exécution du whisper base model nécessite moins de 1 Go de mémoire disponible, et les résultats sont passables sans bruit et taux de précision d'environ 90% dans des situations de langage parlées précises. Le whisper large model nécessite plus de 8 Go de mémoire disponible, mais il offre d'excellentes performances. Même mes pauvres compétences en anglais sont reconnues assez précisément. De plus, il gère les longs segments de parole et les interruptions de manière assez efficace.
En résumé, le modèle de base est plus convivial, mais si les conditions le permettent, il est recommandé d'utiliser le grand modèle. En cas d'erreurs de reconnaissance, les modifications peuvent être directement apportées aux résultats reconnus dans l'interface graphique.
Repo clone
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoiceCréer et activer un environnement virtuel. (PowerShell. Dans Bash, vous devrez peut-être exécuter des scripts comme Activate.)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1Installez les dépendances.
pip install -r requirements.txtDans Linux, vous devez exécuter la commande suivante pour installer les dépendances requises.
apt install portaudio19-dev python3-pyaudio
apt install espeakExécutez directement dans l'env.
python ./main.py
J'ai un hôte Linux avec 12 Go de mémoire GPU et un ordinateur portable avec un GPU de 1650 faible. Pour exécuter le modèle Whisper Large, vous pouvez héberger Whisper sur Linux et utiliser la communication WebSocket entre le client et Whisper.
Linux:
python scrpit/whisper_server.py --model large-v2
client:
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809Après avoir activé le proxy, toutes les demandes et téléchargements Openai GPT passeront par le nœud proxy.
Pyqt-fluent-widgets une bibliothèque de widgets de conception couramment basé sur pyqt5