Descargar ChatGPTVoice - Descargar el código fuente de ChatGPTVoice

ChatGPTVoice

Código Fuente de IA

1.0.0

Descargar

ChatgptVoice

中文

Base en Whisper y Pyqt (Pyside6), una herramienta de chat de voz en tiempo real, que respalda conversaciones históricas. Disfruta chatear con la voz GPT sin confiar en Chatgpt Plus. ?

Requisito

Python> = 3.10

Sistema operativo

Win10+, Linux (solo prueba en Ubuntu, funciona), Mac (basado en Linux como referencia, teóricamente factible, pero no probado).

GPU

Ejecutar el whisper base model requiere menos de 1 GB de la memoria disponible, y los resultados se pueden aprobar sin ruido y una tasa de precisión de alrededor del 90% en situaciones precisas del lenguaje hablado. El whisper large model requiere más de 8 GB de memoria disponible, pero proporciona un excelente rendimiento. Incluso mis malas habilidades de habla inglesa se reconocen con bastante precisión. Además, maneja segmentos e interrupciones largos del habla de manera bastante efectiva.

En resumen, el modelo base es más fácil de usar, pero si las condiciones lo permiten, se recomienda usar el modelo grande. En casos de errores de reconocimiento, se pueden hacer modificaciones directamente a los resultados reconocidos en la GUI.

Instalar

Repositorio

git clone https://github.com/QureL/ChatGPTVoice.git
cd ChatGPTVoice

Cree y active un entorno virtual. (PowerShell. En Bash, es posible que deba ejecutar scripts como activar).

mkdir venv
python - m venv .venv
.venvScriptsActivate.ps1

Instalar dependencias.

pip install -r requirements.txt

En Linux, debe ejecutar el siguiente comando para instalar las dependencias requeridas.

apt install portaudio19-dev python3-pyaudio
apt install espeak

Correr

Ejecutar directamente dentro del env. Virtual Env.

 python ./main.py

Whisper corre de forma remota

Tengo un host de Linux con 12 GB de memoria GPU y una computadora portátil con una GPU débil de 1650. Para ejecutar el modelo Whisper grande, puede alojar susurros en Linux y usar la comunicación de WebSocket entre el cliente y el susurro.

Linux:

 python scrpit/whisper_server.py --model large-v2

cliente:

 python .main.py --whisper_mode remote --whisper_address ws://{You Linux IP}:3001

Proxy para OpenAi

python .main.py -- proxy http: // 127.0 . 0.1 : 10809

Después de habilitar el proxy, todas las solicitudes y descargas de modelos de OpenAI GPT pasarán a través del nodo proxy.

Gracias

Pyqt-fluent-widgets Una biblioteca de widgets de diseño fluido basada en Pyqt5

Lista de tareas

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-22
tamaño 101.2KB
Proviene de Github

Aplicaciones relacionadas

GLM 4 Voice

2024-11-02
flutter_voice_friend

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
Interfaz SMS ilimitada de GOOGLE VOICE

2009-11-07

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo

OpenAI está a punto de lanzar un agente de IA, una innovación con el impacto de ChatGPT
2024-11-15