Descarga silero tts api server - Descargar código fuente silero tts api server Descargar

Descargar

Bandera

Idiomas compatibles

Nota

Todos los modelos son del repositorio: Snakers4/Silero-Models

Idioma	Modelo	Altavoces
ruso	V4_RU	5: AIDAR, Baya, Kseniya, Xenia, Eugene
ucranio	V4_UA	1: Mykyta
Uzbek	V4_UZ	1: Dilnavoz
Inglés	v3_en	118: EN_0, EN_1, ..., EN_117
Español	V3_ES	3: ES_0, ES_1, ES_2
Francés	V3_FR	6: FR_0, FR_1, FR_2, FR_3, FR_4, FR_5
Alemán	V3_DE	5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson
Tártaro	v3_tt	1: Dilyara
mongol	V3_XAL	2: Erdni, Delghir

Importante

Esto requiere instalado Docker y el Docker Daemon Running

docker run --rm -p 8000:8000 twirapp/silero-tts-api-server

Construir y ejecutar desde el repositorio local

Clon el repositorio:

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Build Docker Imagen:

docker build -f docker/Dockerfile -t silero-tts-api-server .

Ejecute el contenedor:

docker run --rm -p 8000:8000 silero-tts-api-server

O use Docker Compose:

docker-compose -f docker/compose.yml up

Importante

Requisito mínimo Python 3.9

Este proyecto usa Rye para la gestión de dependencias, supone que lo ha instalado

Clonar el repositorio

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Nota

El valor predeterminado será localhost: 8000

Puede ver la documentación generada automáticamente basada en OpenAPI en:

Proveedor	Url
Pavonearse	https: // localhost: 8000/esquema/
Redoc	https: // localhost: 8000/esquema/redoc
Elementos de semáforo	https: // localhost: 8000/esquema/elementos
Repido	https: // localhost: 8000/esquema/repidoc
Openapi Schema Yaml	https: // localhost: 8000/schema/openapi.yaml
Schema de Openapi JSON	https: // localhost: 8000/schema/openapi.json

GET /generate : generar audio en formato WAV desde el texto. Parámetros: speaker text sample_rate , pitch , rate
GET /speakers - Obtener la lista de altavoces

sample_rate se puede establecer de 8 000, 24 000, 48 000 pitch y rate se pueden establecer de 0 a 100

TEXT_LENGTH_LIMIT : longitud máxima del texto a procesar. El valor predeterminado es de 930 caracteres.
MKL_NUM_THREADS : número de hilos para usar para generar audio. Número predeterminado de subprocesos: número de núcleos de CPU.