
Nota
Todos los modelos son del repositorio: Snakers4/Silero-Models
| Idioma | Modelo | Altavoces |
|---|---|---|
| ruso | V4_RU | 5: AIDAR, Baya, Kseniya, Xenia, Eugene |
| ucranio | V4_UA | 1: Mykyta |
| Uzbek | V4_UZ | 1: Dilnavoz |
| Inglés | v3_en | 118: EN_0, EN_1, ..., EN_117 |
| Español | V3_ES | 3: ES_0, ES_1, ES_2 |
| Francés | V3_FR | 6: FR_0, FR_1, FR_2, FR_3, FR_4, FR_5 |
| Alemán | V3_DE | 5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson |
| Tártaro | v3_tt | 1: Dilyara |
| mongol | V3_XAL | 2: Erdni, Delghir |
Importante
Esto requiere instalado Docker y el Docker Daemon Running
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverClon el repositorio:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverBuild Docker Imagen:
docker build -f docker/Dockerfile -t silero-tts-api-server .Ejecute el contenedor:
docker run --rm -p 8000:8000 silero-tts-api-serverO use Docker Compose:
docker-compose -f docker/compose.yml upImportante
Requisito mínimo Python 3.9
Este proyecto usa Rye para la gestión de dependencias, supone que lo ha instalado
Clonar el repositorio
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverInstalar dependencias
Esto creará automáticamente el entorno virtual en el directorio .venv e instalará las dependencias requeridas
rye syncpython3 -m venv .venv && source .venv/bin/activateInstale solo las dependencias requeridas:
pip3 install --no-deps -r requirements.lockDescargar modelos Silero TTS
bash ./install_models.shEjecutar el servidor
litestar runNota
El valor predeterminado será localhost: 8000
Puede ver la documentación generada automáticamente basada en OpenAPI en:
| Proveedor | Url |
|---|---|
| Pavonearse | https: // localhost: 8000/esquema/ |
| Redoc | https: // localhost: 8000/esquema/redoc |
| Elementos de semáforo | https: // localhost: 8000/esquema/elementos |
| Repido | https: // localhost: 8000/esquema/repidoc |
| Openapi Schema Yaml | https: // localhost: 8000/schema/openapi.yaml |
| Schema de Openapi JSON | https: // localhost: 8000/schema/openapi.json |
GET /generate : generar audio en formato WAV desde el texto. Parámetros: speaker text sample_rate , pitch , rateGET /speakers - Obtener la lista de altavoces sample_rate se puede establecer de 8 000, 24 000, 48 000 pitch y rate se pueden establecer de 0 a 100
TEXT_LENGTH_LIMIT : longitud máxima del texto a procesar. El valor predeterminado es de 930 caracteres.MKL_NUM_THREADS : número de hilos para usar para generar audio. Número predeterminado de subprocesos: número de núcleos de CPU.Este repositorio está dedicado a Twir.App y está diseñado para cumplir con sus requisitos.
TwirApp necesita generar audio utilizando la CPU. Si se necesita soporte para otros dispositivos como CUDA o MPS, abra un problema.