silero tts api server Download - silero tts api server Quellcode Download

Herunterladen

Banner

Sprachen unterstützt

Notiz

Alle Modelle stammen aus dem Repository: Snakers4/Silero-Modelle

Sprache	Modell	Sprecher
Russisch	v4_ru	5: Aidar, Baya, Kseniya, Xenia, Eugene
ukrainisch	v4_ua	1: Mykyta
Usbekisch	v4_uz	1: Dilnavoz
Englisch	v3_en	118: en_0, en_1, ..., en_117
Spanisch	v3_es	3: ES_0, ES_1, ES_2
Französisch	v3_fr	6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5
Deutsch	v3_de	5: Bernd_ungerer, Eva_k, Friedrich, Hokuspokus, Karlsson
Tatar	v3_tt	1: Dilyara
mongolisch	v3_xal	2: Erdni, Delghir

Wichtig

Dies erfordert, dass Docker installiert und der Docker -Daemon ausgeführt wird

docker run --rm -p 8000:8000 twirapp/silero-tts-api-server

Erstellen und laufen Sie aus lokalem Repository aus

Klonen Sie das Repository:

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Docker -Bild erstellen:

docker build -f docker/Dockerfile -t silero-tts-api-server .

Führen Sie den Container aus:

docker run --rm -p 8000:8000 silero-tts-api-server

Oder verwenden Sie Docker Compose:

docker-compose -f docker/compose.yml up

Wichtig

Mindestanforderung Python 3.9

In diesem Projekt wird Rye für das Abhängigkeitsmanagement verwendet, es wird davon ausgegangen, dass Sie es installiert haben

Klonen Sie das Repository

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Notiz

Der Standard ist localhost: 8000

Sie können die automatisch generierte Dokumentation basierend auf OpenAPI anzeigen unter:

Anbieter	URL
Stolzieren	https: // localhost: 8000/schema/
Redoc	https: // localhost: 8000/schema/redoc
Ampelelemente	https: // localhost: 8000/schema/Elemente
Repidoc	https: // localhost: 8000/schema/repidoc
OpenAPI -Schema Yaml	https: // localhost: 8000/schema/openapi.yaml
OpenAPI -Schema JSON	https: // localhost: 8000/schema/openAPI.json

GET /generate - Audio im WAV -Format aus Text erzeugen. Parameter: text speaker sample_rate pitch , rate
GET /speakers - Holen Sie sich eine Liste von Sprechern

sample_rate kann von 8 000, 24 000, 48 000 pitch eingestellt werden und rate kann von 0 auf 100 eingestellt werden

TEXT_LENGTH_LIMIT - Maximale Länge des zu verarbeitenden Textes. Standard ist 930 Zeichen.
MKL_NUM_THREADS - Anzahl der Threads, die zum Generieren von Audio verwendet werden sollen. Standardnummer der Threads: Anzahl der CPU -Kerne.