silero tts api server
1.0.0

注記
すべてのモデルはリポジトリからのものです:Snakers4/Silero-Models
| 言語 | モデル | スピーカー |
|---|---|---|
| ロシア | V4_ru | 5:エイダー、バヤ、クセニヤ、ゼニア、ユージーン |
| ウクライナ人 | v4_ua | 1:Mykyta |
| ウズベック | V4_UZ | 1:ディルナボズ |
| 英語 | V3_en | 118:en_0、en_1、...、en_117 |
| スペイン語 | V3_ES | 3:ES_0、ES_1、ES_2 |
| フランス語 | v3_fr | 6:FR_0、FR_1、FR_2、FR_3、FR_4、FR_5 |
| ドイツ語 | V3_DE | 5:Bernd_ungerer、EVA_K、Friedrich、Hokuspokus、Karlsson |
| タタール | V3_TT | 1:ダイヤラ |
| モンゴル人 | v3_xal | 2:Erdni、Delghir |
重要
これには、Dockerがインストールされ、Dockerデーモンが実行される必要があります
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverリポジトリをクローンします:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverDockerイメージを構築する:
docker build -f docker/Dockerfile -t silero-tts-api-server .コンテナを実行します:
docker run --rm -p 8000:8000 silero-tts-api-serverまたは、Docker Composeを使用してください。
docker-compose -f docker/compose.yml up重要
最小要件Python 3.9
このプロジェクトは、依存関係管理にライ麦を使用しています、それはあなたがそれをインストールしたことを前提としています
リポジトリをクローンします
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server依存関係をインストールします
これにより、 .venvディレクトリに仮想環境が自動的に作成され、必要な依存関係がインストールされます
rye syncpython3 -m venv .venv && source .venv/bin/activate必要な依存関係のみをインストールします。
pip3 install --no-deps -r requirements.lockSileroTTSモデルをダウンロードします
bash ./install_models.shサーバーを実行します
litestar run注記
デフォルトはlocalhost:8000になります
Openapiに基づいて自動的に生成されたドキュメントを表示できます。
| プロバイダー | URL |
|---|---|
| sw歩 | https:// localhost:8000/schema/ |
| redoc | https:// localhost:8000/schema/redoc |
| ストップライト要素 | https:// localhost:8000/schema/elements |
| repidoc | https:// localhost:8000/schema/repidoc |
| Openapi Schema Yaml | https:// localhost:8000/schema/openapi.yaml |
| Openapi Schema Json | https:// localhost:8000/schema/openapi.json |
GET /generate - テキストからWAV形式でオーディオを生成します。パラメーター: text speaker sample_rate 、 pitch 、 rateGET /speakers - スピーカーのリストを取得しますsample_rate 8 000、24 000、48 000のpitchに設定でき、 rateは0から100に設定できます
TEXT_LENGTH_LIMIT処理するテキストの最大長。デフォルトは930文字です。MKL_NUM_THREADSオーディオの生成に使用するスレッドの数。デフォルトのスレッド数:CPUコアの数。このリポジトリはTwir.App専用であり、要件を満たすように設計されています。
TwirAppは、CPUを使用してオーディオを生成する必要があります。 CUDAやMPSなどの他のデバイスのサポートが必要な場合は、問題を開いてください。