Download silero tts api server - silero tts api server download do código -fonte

Baixar

Bandeira

Idiomas suportados

Observação

Todos os modelos são do repositório: Snakers4/Silero-Models

Linguagem	Modelo	Alto -falantes
russo	v4_ru	5: Aidar, Baya, Kseniya, Xenia, Eugene
ucraniano	v4_ua	1: Mykyta
Uzbek	v4_uz	1: Dilnavoz
Inglês	v3_en	118: en_0, en_1, ..., en_117
Espanhol	v3_es	3: ES_0, ES_1, ES_2
Francês	v3_fr	6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5
Alemão	v3_de	5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson
Tatar	v3_tt	1: Dilyara
mongol	v3_xal	2: Erdni, Delghir

Importante

Isso requer o Docker instalado e o Docker Daemon Running

docker run --rm -p 8000:8000 twirapp/silero-tts-api-server

Construir e fugir do repositório local

Clone o repositório:

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Construa a imagem do Docker:

docker build -f docker/Dockerfile -t silero-tts-api-server .

Execute o contêiner:

docker run --rm -p 8000:8000 silero-tts-api-server

Ou use Docker Compose:

docker-compose -f docker/compose.yml up

Importante

Requisito mínimo Python 3.9

Este projeto usa centeio para gerenciamento de dependência, assume que você o instalou

Clone o repositório

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Observação

O padrão será localhost: 8000

Você pode visualizar a documentação gerada automaticamente com base no OpenAPI em:

Provedor	Url
Swagger	https: // localhost: 8000/esquema/
Redoc	https: // localhost: 8000/esquema/redoc
Elementos de semáforo	https: // localhost: 8000/esquema/elementos
Repidoc	https: // localhost: 8000/schema/repidoc
Esquema Openapi Yaml	https: // localhost: 8000/schema/openapi.yaml
Openapi Schema JSON	https: // localhost: 8000/schema/openapi.json

GET /generate - Gere áudio no formato WAV a partir do texto. Parâmetros: speaker text sample_rate , pitch , rate
GET /speakers - Obtenha a lista de alto -falantes

sample_rate pode ser definido de 8 000, 24 000, 48 000 pitch e rate pode ser definida de 0 a 100

TEXT_LENGTH_LIMIT - Comprimento máximo do texto a ser processado. O padrão é de 930 caracteres.
MKL_NUM_THREADS - número de threads a serem usados para gerar áudio. Número padrão de threads: número de núcleos da CPU.