
Notiz
Alle Modelle stammen aus dem Repository: Snakers4/Silero-Modelle
| Sprache | Modell | Sprecher |
|---|---|---|
| Russisch | v4_ru | 5: Aidar, Baya, Kseniya, Xenia, Eugene |
| ukrainisch | v4_ua | 1: Mykyta |
| Usbekisch | v4_uz | 1: Dilnavoz |
| Englisch | v3_en | 118: en_0, en_1, ..., en_117 |
| Spanisch | v3_es | 3: ES_0, ES_1, ES_2 |
| Französisch | v3_fr | 6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5 |
| Deutsch | v3_de | 5: Bernd_ungerer, Eva_k, Friedrich, Hokuspokus, Karlsson |
| Tatar | v3_tt | 1: Dilyara |
| mongolisch | v3_xal | 2: Erdni, Delghir |
Wichtig
Dies erfordert, dass Docker installiert und der Docker -Daemon ausgeführt wird
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverKlonen Sie das Repository:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverDocker -Bild erstellen:
docker build -f docker/Dockerfile -t silero-tts-api-server .Führen Sie den Container aus:
docker run --rm -p 8000:8000 silero-tts-api-serverOder verwenden Sie Docker Compose:
docker-compose -f docker/compose.yml upWichtig
Mindestanforderung Python 3.9
In diesem Projekt wird Rye für das Abhängigkeitsmanagement verwendet, es wird davon ausgegangen, dass Sie es installiert haben
Klonen Sie das Repository
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverAbhängigkeiten installieren
Dadurch wird automatisch die virtuelle Umgebung im Verzeichnis .venv erstellt und die erforderlichen Abhängigkeiten installiert
rye syncpython3 -m venv .venv && source .venv/bin/activateInstallieren Sie nur die erforderlichen Abhängigkeiten:
pip3 install --no-deps -r requirements.lockLaden Sie Silero TTS -Modelle herunter
bash ./install_models.shFühren Sie den Server aus
litestar runNotiz
Der Standard ist localhost: 8000
Sie können die automatisch generierte Dokumentation basierend auf OpenAPI anzeigen unter:
| Anbieter | URL |
|---|---|
| Stolzieren | https: // localhost: 8000/schema/ |
| Redoc | https: // localhost: 8000/schema/redoc |
| Ampelelemente | https: // localhost: 8000/schema/Elemente |
| Repidoc | https: // localhost: 8000/schema/repidoc |
| OpenAPI -Schema Yaml | https: // localhost: 8000/schema/openapi.yaml |
| OpenAPI -Schema JSON | https: // localhost: 8000/schema/openAPI.json |
GET /generate - Audio im WAV -Format aus Text erzeugen. Parameter: text speaker sample_rate pitch , rateGET /speakers - Holen Sie sich eine Liste von Sprechern sample_rate kann von 8 000, 24 000, 48 000 pitch eingestellt werden und rate kann von 0 auf 100 eingestellt werden
TEXT_LENGTH_LIMIT - Maximale Länge des zu verarbeitenden Textes. Standard ist 930 Zeichen.MKL_NUM_THREADS - Anzahl der Threads, die zum Generieren von Audio verwendet werden sollen. Standardnummer der Threads: Anzahl der CPU -Kerne.Dieses Repository ist Twir.App gewidmet und ist so konzipiert, dass er seine Anforderungen entspricht.
Twirapp muss mit der CPU Audio generieren. Wenn Unterstützung für andere Geräte wie CUDA oder MPS benötigt wird, öffnen Sie bitte ein Problem.