whisperspeech webui
2.2
UI da web para Whisperspeech (https://github.com/collabora/whisperspeech)

Observação
Versão 2.x Agora permite a geração de voz via API.
| Nome | Informações |
|---|---|
| CPU | AMD RYZEN 7900X3D (IGPU desativada no BIOS) |
| GPU | AMD RADEON 7900XTX |
| BATER | 64 GB DDR5 6600MHz |
| Placa -mãe | ASROCK B650E PG RIPTIDE WIFI (3,08) |
| OS | Ubuntu 24.04 |
| Kernel | 6.8.0-47-genérico |
| Rocm | 6.2.2 |
| Nome | Informações |
|---|---|
| CPU | Intelcore i5-12500H |
| GPU | Nvidia GeForce RTX 4050 |
| BATER | 16 GB DDR4 3200MHz |
| Placa -mãe | Gigabyte G5 MF (BIOS FB10) |
| OS | Ubuntu 24.10 |
| Kernel | 6.11.0-9-genérico |
| Motorista nvidia | 560.35.03 |
| CUDA | 12.6.2 |
1. Instale o Python 3.12
2. Repositório de clones
3. Monte o diretório do repositório.
3. Crie e ative Venv
4. Para ROCM, defina hsa_override_gfx_version. Para o Radeon 7900XTX:
export HSA_OVERRIDE_GFX_VERSION=11.0.05. Instale o ffmpeg:
Ubuntu 24.04/24.10:
sudo apt install ffmpeg6. Instale os requisitos
CPU (não recomendado):
pip install -r requirements.txtCUDA 12.4:
pip install -r requrements_cuda_12.1.txtROCM 6.2
pip install -r requirements_rocm_6.2.txt7. Run:
python webui.pyCom -h ou --help para obter ajuda:
python webui.py -h| Idiomas |
|---|
| Inglês |
| polonês |
1. Instale Pybabel:
pip install babel==2.16.02. Extrair mensagens.pot:
pybabel extract -F babel.cfg -o ./locale/messages.pot . 3. Crie novo:
pybabel init -i ./locale/messages.pot -d ./locale -l pl_PL
# Replace pl_PL by your language4. Compilar:
pybabel compile -d ./locale