Скачать silero tts api server - Скачать исходный код silero tts api server Загрузите

Скачать

Баннер

Языки поддерживаются

Примечание

Все модели взяты из репозитория: Snakers4/Silero-Models

Язык	Модель	Докладчики
Русский	v4_ru	5: Эйдар, Бая, Ксения, Ксения, Юджин
Украинский	v4_ua	1: Микита
Узбек	v4_uz	1: Дилнавоз
Английский	v3_en	118: en_0, en_1, ..., en_117
испанский	V3_ES	3: ES_0, ES_1, ES_2
Французский	v3_fr	6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5
немецкий	v3_de	5: bernd_ungerer, eva_k, friedrich, hokuspokus, Карлссон
Татар	v3_tt	1: Диляра
Монгольский	v3_xal	2: Erdni, Delghir

Важный

Это требует установленного Docker, а Docker Daemon работает

docker run --rm -p 8000:8000 twirapp/silero-tts-api-server

Стройте и бегите из местного репозитория

Клонировать репозиторий:

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Построить изображение Docker:

docker build -f docker/Dockerfile -t silero-tts-api-server .

Запустите контейнер:

docker run --rm -p 8000:8000 silero-tts-api-server

Или используйте Docker Compose:

docker-compose -f docker/compose.yml up

Важный

Минимальное требование Python 3.9

Этот проект использует Rye для управления зависимостями, он предполагает, что вы его установили

Клонировать репозиторий

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Примечание

По умолчанию будет Localhost: 8000

Вы можете просмотреть автоматически сгенерированную документацию на основе OpenAPI AT:

Поставщик	URL
Чванство	https: // localhost: 8000/схема/
Redoc	https: // localhost: 8000/schema/redoc
Элементы стоп -света	https: // localhost: 8000/схема/элементы
Repidoc	https: // localhost: 8000/schema/repidoc
Openapi Schema Yaml	https: // localhost: 8000/schema/openapi.yaml
Openapi схема JSON	https: // localhost: 8000/schema/openapi.json

GET /generate - генерировать аудио в формате WAV из текста. Параметры: text speaker sample_rate , pitch , rate
GET /speakers - Получите список динамиков

sample_rate может быть установлен с 8 000, 24 000, 48 000 pitch , а rate могут быть установлены от 0 до 100

TEXT_LENGTH_LIMIT - максимальная длина обработки текста. По умолчанию 930 символов.
MKL_NUM_THREADS - Количество потоков для использования для генерации аудио. По умолчанию количество потоков: количество ядер ЦП.