
Note
Tous les modèles proviennent du référentiel: Snakers4 / SILERO-Models
| Langue | Modèle | Conférenciers |
|---|---|---|
| russe | v4_ru | 5: Aidar, Baya, Kseniya, Xenia, Eugene |
| ukrainien | v4_ua | 1: Mykyta |
| Ouzbek | v4_uz | 1: Dilnavoz |
| Anglais | v3_en | 118: en_0, en_1, ..., en_117 |
| Espagnol | v3_es | 3: es_0, es_1, es_2 |
| Français | v3_fr | 6: FR_0, FR_1, FR_2, FR_3, FR_4, FR_5 |
| Allemand | v3_de | 5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson |
| tatar | v3_tt | 1: Dilyara |
| mongol | v3_xal | 2: Erdni, Delghir |
Important
Cela nécessite un docker installé et le démon docker en cours d'exécution
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverClone le référentiel:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverConstruire l'image Docker:
docker build -f docker/Dockerfile -t silero-tts-api-server .Exécutez le conteneur:
docker run --rm -p 8000:8000 silero-tts-api-serverOu utilisez Docker Compose:
docker-compose -f docker/compose.yml upImportant
Exigence minimale Python 3.9
Ce projet utilise le seigle pour la gestion des dépendances, il suppose que vous l'avez installé
Cloner le référentiel
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverInstaller des dépendances
Cela créera automatiquement l'environnement virtuel dans le répertoire .venv et installera les dépendances requises
rye syncpython3 -m venv .venv && source .venv/bin/activateInstallez uniquement les dépendances requises:
pip3 install --no-deps -r requirements.lockTélécharger les modèles SILERO TTS
bash ./install_models.shExécuter le serveur
litestar runNote
La valeur par défaut sera locale: 8000
Vous pouvez afficher la documentation générée automatiquement sur la base d'OpenAPI à:
| Fournisseur | URL |
|---|---|
| Fanfarner | https: // localhost: 8000 / schéma / |
| Redoc | https: // localhost: 8000 / schéma / redoc |
| Éléments de feuilles | https: // localhost: 8000 / schéma / éléments |
| Répodoc | https: // localhost: 8000 / schéma / repidoc |
| Schéma openap yaml | https: // localhost: 8000 / schéma / openapi.yaml |
| Schéma OpenAPI JSON | https: // localhost: 8000 / schéma / openapi.json |
GET /generate - Générez de l'audio au format WAV à partir du texte. Paramètres: text speaker sample_rate , pitch , rateGET /speakers - obtenez la liste des conférenciers sample_rate peut être défini à partir de 8 000, 24 000, 48 000, pitch et rate peuvent être réglés de 0 à 100
TEXT_LENGTH_LIMIT - longueur maximale du texte à traiter. La valeur par défaut est de 930 caractères.MKL_NUM_THREADS - Nombre de threads à utiliser pour générer l'audio. Nombre de threads par défaut: Nombre de cœurs de CPU.Ce référentiel est dédié à Twir.app et est conçu pour répondre à ses exigences.
Twirapp doit générer de l'audio à l'aide du CPU. Si la prise en charge d'autres appareils tels que CUDA ou MPS est nécessaire, veuillez ouvrir un problème.