中文
Whisper and Pyqt (Pyside6)를 기반으로 한 실시간 음성 GPT 채팅 도구, 역사적 대화를 지원합니다. Chatgpt Plus에 의존하지 않고 GPT 음성과 채팅을 즐기십시오. ??
파이썬> = 3.10
Win10+, Linux (Ubuntu에서 테스트, Works에서 테스트), Mac (Linux를 기준으로 이론적으로 실현 가능하지만 테스트되지 않았습니다.)
whisper base model 실행하려면 1GB 미만의 가용 메모리가 필요하며 결과는 정확한 구 음력 상황에서 노이즈와 정확도가 약 90%로 통과 할 수 있습니다. whisper large model 8GB 이상의 가용 메모리가 필요하지만 탁월한 성능을 제공합니다. 저의 가난한 영어 말하기 기술조차도 상당히 정확하게 인식됩니다. 또한, 긴 음성 세그먼트와 중단을 매우 효과적으로 처리합니다.
요약하면, 기본 모델은보다 사용자 친화적이지만 조건이 허용되면 대형 모델을 사용하는 것이 좋습니다. 인식 오류의 경우 GUI에서 인식 된 결과로 직접 수정할 수 있습니다.
복제 레포
git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoice가상 환경을 만들고 활성화하십시오. (PowerShell. Bash에서는 활성화와 같은 스크립트를 실행해야 할 수도 있습니다.)
mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1종속성을 설치하십시오.
pip install -r requirements.txtLinux에서는 필요한 종속성을 설치하려면 다음 명령을 실행해야합니다.
apt install portaudio19-dev python3-pyaudio
apt install espeak가상 환경 내에서 직접 실행하십시오.
python ./main.py
12GB의 GPU 메모리가있는 Linux 호스트와 1650 GPU가 약한 노트북이 있습니다. Whisper Large Model을 실행하려면 Linux에서 Whisper를 호스팅하고 고객과 Whisper 간의 WebSocket 커뮤니케이션을 사용할 수 있습니다.
리눅스 :
python scrpit/whisper_server.py --model large-v2
고객:
python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001
python .main.py -- proxy http: // 127.0 . 0.1 : 10809프록시를 활성화하면 모든 OpenAI GPT 요청 및 모델 다운로드가 프록시 노드를 통과합니다.
PYQT-Fluent-Widget은 PYQT5를 기반으로 유창한 디자인 위젯 라이브러리를 제공합니다