
Observação
Todos os modelos são do repositório: Snakers4/Silero-Models
| Linguagem | Modelo | Alto -falantes |
|---|---|---|
| russo | v4_ru | 5: Aidar, Baya, Kseniya, Xenia, Eugene |
| ucraniano | v4_ua | 1: Mykyta |
| Uzbek | v4_uz | 1: Dilnavoz |
| Inglês | v3_en | 118: en_0, en_1, ..., en_117 |
| Espanhol | v3_es | 3: ES_0, ES_1, ES_2 |
| Francês | v3_fr | 6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5 |
| Alemão | v3_de | 5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson |
| Tatar | v3_tt | 1: Dilyara |
| mongol | v3_xal | 2: Erdni, Delghir |
Importante
Isso requer o Docker instalado e o Docker Daemon Running
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverClone o repositório:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverConstrua a imagem do Docker:
docker build -f docker/Dockerfile -t silero-tts-api-server .Execute o contêiner:
docker run --rm -p 8000:8000 silero-tts-api-serverOu use Docker Compose:
docker-compose -f docker/compose.yml upImportante
Requisito mínimo Python 3.9
Este projeto usa centeio para gerenciamento de dependência, assume que você o instalou
Clone o repositório
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverInstalar dependências
Isso criará automaticamente o ambiente virtual no diretório .venv e instalará as dependências necessárias
rye syncpython3 -m venv .venv && source .venv/bin/activateInstale apenas as dependências necessárias:
pip3 install --no-deps -r requirements.lockBaixar modelos Silero TTS
bash ./install_models.shExecute o servidor
litestar runObservação
O padrão será localhost: 8000
Você pode visualizar a documentação gerada automaticamente com base no OpenAPI em:
| Provedor | Url |
|---|---|
| Swagger | https: // localhost: 8000/esquema/ |
| Redoc | https: // localhost: 8000/esquema/redoc |
| Elementos de semáforo | https: // localhost: 8000/esquema/elementos |
| Repidoc | https: // localhost: 8000/schema/repidoc |
| Esquema Openapi Yaml | https: // localhost: 8000/schema/openapi.yaml |
| Openapi Schema JSON | https: // localhost: 8000/schema/openapi.json |
GET /generate - Gere áudio no formato WAV a partir do texto. Parâmetros: speaker text sample_rate , pitch , rateGET /speakers - Obtenha a lista de alto -falantes sample_rate pode ser definido de 8 000, 24 000, 48 000 pitch e rate pode ser definida de 0 a 100
TEXT_LENGTH_LIMIT - Comprimento máximo do texto a ser processado. O padrão é de 930 caracteres.MKL_NUM_THREADS - número de threads a serem usados para gerar áudio. Número padrão de threads: número de núcleos da CPU.Este repositório é dedicado ao Twir.App e foi projetado para atender aos seus requisitos.
O TwirApp precisa gerar áudio usando a CPU. Se for necessário suporte a outros dispositivos, como CUDA ou MPS, abra um problema.