ChatGPTVoice
1.0.0
中文
基于Whisper和Pyqt(Pyside6),这是一种实时语音GPT聊天工具,支持历史对话。享受与GPT声音聊天的情况,而无需依靠Chatgpt Plus。 ?
Python> = 3.10
Win10+,Linux(仅在Ubuntu,Works中进行测试),Mac(基于Linux作为参考,理论上可行,但不进行测试。)
在准确的口语情况下,运行whisper base model需要少于1GB的可用内存,并且无法通过噪声和准确率约为90%。 whisper large model需要超过8GB的可用内存,但它提供了出色的性能。即使是我的英语技巧不佳,也得到了相当准确的认可。此外,它非常有效地处理较长的语音段和中断。
总而言之,基本模型更具用户友好,但是如果条件允许,建议使用大型模型。在识别错误的情况下,可以直接对GUI中的公认结果进行修改。
克隆回购
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoice创建并激活虚拟环境。(PowerShell。在bash中,您可能需要运行诸如激活之类的脚本。)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1安装依赖项。
pip install -r requirements.txt在Linux中,您需要运行以下命令来安装所需的依赖项。
apt install portaudio19-dev python3-pyaudio
apt install espeak直接在虚拟env中执行。
python ./main.py
我有一个带有12GB GPU内存的Linux主机和一个具有弱1650 GPU的笔记本电脑。为了运行耳语大型模型,您可以在Linux上托管Wishper,并使用客户和耳语之间的Websocket通信。
Linux:
python scrpit/whisper_server.py --model large-v2
客户:
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809启用代理后,所有OpenAI GPT请求和模型下载都将通过代理节点。
pyqt-fluent-witgets基于pyqt5的流利设计小部件库