
Примечание
Все модели взяты из репозитория: Snakers4/Silero-Models
| Язык | Модель | Докладчики |
|---|---|---|
| Русский | v4_ru | 5: Эйдар, Бая, Ксения, Ксения, Юджин |
| Украинский | v4_ua | 1: Микита |
| Узбек | v4_uz | 1: Дилнавоз |
| Английский | v3_en | 118: en_0, en_1, ..., en_117 |
| испанский | V3_ES | 3: ES_0, ES_1, ES_2 |
| Французский | v3_fr | 6: fr_0, fr_1, fr_2, fr_3, fr_4, fr_5 |
| немецкий | v3_de | 5: bernd_ungerer, eva_k, friedrich, hokuspokus, Карлссон |
| Татар | v3_tt | 1: Диляра |
| Монгольский | v3_xal | 2: Erdni, Delghir |
Важный
Это требует установленного Docker, а Docker Daemon работает
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverКлонировать репозиторий:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverПостроить изображение Docker:
docker build -f docker/Dockerfile -t silero-tts-api-server .Запустите контейнер:
docker run --rm -p 8000:8000 silero-tts-api-serverИли используйте Docker Compose:
docker-compose -f docker/compose.yml upВажный
Минимальное требование Python 3.9
Этот проект использует Rye для управления зависимостями, он предполагает, что вы его установили
Клонировать репозиторий
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverУстановить зависимости
Это автоматически создаст виртуальную среду в каталоге .venv и установит необходимые зависимости
rye syncpython3 -m venv .venv && source .venv/bin/activateУстановите только необходимые зависимости:
pip3 install --no-deps -r requirements.lockСкачать модели Silero TTS
bash ./install_models.shЗапустите сервер
litestar runПримечание
По умолчанию будет Localhost: 8000
Вы можете просмотреть автоматически сгенерированную документацию на основе OpenAPI AT:
| Поставщик | URL |
|---|---|
| Чванство | https: // localhost: 8000/схема/ |
| Redoc | https: // localhost: 8000/schema/redoc |
| Элементы стоп -света | https: // localhost: 8000/схема/элементы |
| Repidoc | https: // localhost: 8000/schema/repidoc |
| Openapi Schema Yaml | https: // localhost: 8000/schema/openapi.yaml |
| Openapi схема JSON | https: // localhost: 8000/schema/openapi.json |
GET /generate - генерировать аудио в формате WAV из текста. Параметры: text speaker sample_rate , pitch , rateGET /speakers - Получите список динамиков sample_rate может быть установлен с 8 000, 24 000, 48 000 pitch , а rate могут быть установлены от 0 до 100
TEXT_LENGTH_LIMIT - максимальная длина обработки текста. По умолчанию 930 символов.MKL_NUM_THREADS - Количество потоков для использования для генерации аудио. По умолчанию количество потоков: количество ядер ЦП.Этот репозиторий посвящен Twir.App и разработан для удовлетворения его требований.
Twirapp должен генерировать аудио с помощью процессора. Если нужна поддержка других устройств, таких как CUDA или MPS, откройте проблему.