ChatGPTVoice
1.0.0
中文
基於Whisper和Pyqt(Pyside6),這是一種實時語音GPT聊天工具,支持歷史對話。享受與GPT聲音聊天的情況,而無需依靠Chatgpt Plus。 ?
Python> = 3.10
Win10+,Linux(僅在Ubuntu,Works中進行測試),Mac(基於Linux作為參考,理論上可行,但不進行測試。)
在準確的口語情況下,運行whisper base model需要少於1GB的可用內存,並且無法通過噪聲和準確率約為90%。 whisper large model需要超過8GB的可用內存,但它提供了出色的性能。即使是我的英語技巧不佳,也得到了相當準確的認可。此外,它非常有效地處理較長的語音段和中斷。
總而言之,基本模型更具用戶友好,但是如果條件允許,建議使用大型模型。在識別錯誤的情況下,可以直接對GUI中的公認結果進行修改。
克隆回購
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoice創建並激活虛擬環境。 (PowerShell。在bash中,您可能需要運行諸如激活之類的腳本。)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1安裝依賴項。
pip install -r requirements.txt在Linux中,您需要運行以下命令來安裝所需的依賴項。
apt install portaudio19-dev python3-pyaudio
apt install espeak直接在虛擬env中執行。
python ./main.py
我有一個帶有12GB GPU內存的Linux主機和一個具有弱1650 GPU的筆記本電腦。為了運行耳語大型模型,您可以在Linux上託管Wishper,並使用客戶和耳語之間的Websocket通信。
Linux:
python scrpit/whisper_server.py --model large-v2
客戶:
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809啟用代理後,所有OpenAI GPT請求和模型下載都將通過代理節點。
pyqt-fluent-witgets基於pyqt5的流利設計小部件庫