whisperspeech webui
2.2
UI web para Whisperspeech (https://github.com/collabora/whisperspeech)

Nota
La versión 2.x ahora permite la generación de voz a través de API.
| Nombre | Información |
|---|---|
| UPC | AMD Ryzen 7900x3d (IGPU discapacitado en BIOS) |
| GPU | AMD Radeon 7900xtx |
| RAM | 64 GB DDR5 6600MHz |
| Placa madre | Asrock B650E PG Riptide Wifi (3.08) |
| Sistema operativo | Ubuntu 24.04 |
| Núcleo | 6.8.0-47-genérico |
| Rocm | 6.2.2 |
| Nombre | Información |
|---|---|
| UPC | Intelcore i5-12500h |
| GPU | Nvidia GeForce RTX 4050 |
| RAM | 16 GB DDR4 3200MHz |
| Placa madre | Gigabyte G5 MF (BIOS FB10) |
| Sistema operativo | Ubuntu 24.10 |
| Núcleo | 6.11.0-9 genérico |
| Controlador nvidia | 560.35.03 |
| Cuda | 12.6.2 |
1. Instale Python 3.12
2. Repositorio de clones
3. Monte el directorio de repositorio.
3. Crear y activar Venv
4. Para ROCM establecer hsa_override_gfx_version. Para el Radeon 7900xtx:
export HSA_OVERRIDE_GFX_VERSION=11.0.05. Instale ffmpeg:
Ubuntu 24.04/24.10:
sudo apt install ffmpeg6. Instalar requisitos
CPU (no recomendado):
pip install -r requirements.txtCUDA 12.4:
pip install -r requrements_cuda_12.1.txtRocm 6.2
pip install -r requirements_rocm_6.2.txt7. Corre:
python webui.pyCon -h o --help por ayuda:
python webui.py -h| Lenguas |
|---|
| Inglés |
| Polaco |
1. Instale Pybabel:
pip install babel==2.16.02. Extraer mensajes.pot:
pybabel extract -F babel.cfg -o ./locale/messages.pot . 3. Crear nuevo:
pybabel init -i ./locale/messages.pot -d ./locale -l pl_PL
# Replace pl_PL by your language4. Compilar:
pybabel compile -d ./locale