whisperspeech webui
2.2
Web -UI für WhisperSpeech (https://github.com/collabora/whisperspeech)

Notiz
Version 2.x ermöglicht jetzt die Sprachgenerierung über API.
| Name | Info |
|---|---|
| CPU | AMD Ryzen 7900x3d (IGPU in BIOS deaktiviert) |
| GPU | AMD Radeon 7900XTX |
| RAM | 64 GB DDR5 6600MHz |
| Hauptplatine | ASROCK B650E PG RIPTIDE WiFI (3.08) |
| Betriebssystem | Ubuntu 24.04 |
| Kernel | 6.8.0-47-generisch |
| Rocm | 6.2.2 |
| Name | Info |
|---|---|
| CPU | Intelcore i5-12500h |
| GPU | Nvidia Geforce RTX 4050 |
| RAM | 16 GB DDR4 3200MHz |
| Hauptplatine | Gigabyte G5 MF (BIOS FB10) |
| Betriebssystem | Ubuntu 24.10 |
| Kernel | 6.11.0-9-generisch |
| Nvidia -Fahrer | 560.35.03 |
| CUDA | 12.6.2 |
1. Installieren Sie Python 3.12
2. Klonrepository
3.. Mount das Repository -Verzeichnis.
3. Erstellen und aktivieren Sie das Gebiet
4. Für ROCM setzen Sie HSA_Override_GFX_VERSION. Für den Radeon 7900XTX:
export HSA_OVERRIDE_GFX_VERSION=11.0.05. Installieren Sie FFMPEG:
Ubuntu 24.04/24.10:
sudo apt install ffmpeg6. Anforderungen installieren
CPU (nicht empfohlen):
pip install -r requirements.txtCUDA 12.4:
pip install -r requrements_cuda_12.1.txtROCM 6.2
pip install -r requirements_rocm_6.2.txt7. Lauf:
python webui.pyMit -h oder -Help für Hilfe:
python webui.py -h| Sprachen |
|---|
| Englisch |
| Polieren |
1. Installieren Sie Pybabel:
pip install babel==2.16.02. Meldungen extrahieren. POT:
pybabel extract -F babel.cfg -o ./locale/messages.pot . 3. Erstellen Sie neu:
pybabel init -i ./locale/messages.pot -d ./locale -l pl_PL
# Replace pl_PL by your language4. Compile:
pybabel compile -d ./locale