
Catatan
Semua model berasal dari repositori: snakers4/silero-model
| Bahasa | Model | Pembicara |
|---|---|---|
| Rusia | v4_ru | 5: Aidar, Baya, Kseniya, Xenia, Eugene |
| Ukraina | v4_ua | 1: Mykyta |
| Uzbek | v4_uz | 1: Dilnavoz |
| Bahasa inggris | v3_en | 118: en_0, en_1, ..., en_117 |
| Spanyol | v3_es | 3: ES_0, ES_1, ES_2 |
| Perancis | v3_fr | 6: FR_0, FR_1, FR_2, FR_3, FR_4, FR_5 |
| Jerman | v3_de | 5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson |
| Tatar | v3_tt | 1: Dilyara |
| Mongolia | v3_xal | 2: Erdni, Delghir |
Penting
Ini membutuhkan Docker Installed dan Docker Daemon Running
docker run --rm -p 8000:8000 twirapp/silero-tts-api-serverKlon Repositori:
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverBangun Gambar Docker:
docker build -f docker/Dockerfile -t silero-tts-api-server .Jalankan wadah:
docker run --rm -p 8000:8000 silero-tts-api-serverAtau gunakan Docker Compose:
docker-compose -f docker/compose.yml upPenting
Persyaratan Minimum Python 3.9
Proyek ini menggunakan gandum hitam untuk manajemen ketergantungan, ia mengasumsikan Anda telah menginstalnya
Klon Repositori
git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-serverInstal dependensi
Ini akan secara otomatis menciptakan lingkungan virtual di direktori .venv dan menginstal dependensi yang diperlukan
rye syncpython3 -m venv .venv && source .venv/bin/activatePasang hanya dependensi yang diperlukan:
pip3 install --no-deps -r requirements.lockUnduh model Silero TTS
bash ./install_models.shJalankan server
litestar runCatatan
Defaultnya adalah localhost: 8000
Anda dapat melihat dokumentasi yang dihasilkan secara otomatis berdasarkan OpenAPI di:
| Penyedia | Url |
|---|---|
| Menyombongkan | https: // localhost: 8000/skema/ |
| Redoc | https: // localhost: 8000/skema/redoc |
| Elemen lampu lalu lintas | https: // localhost: 8000/skema/elemen |
| Repidoc | https: // localhost: 8000/skema/repidoc |
| Skema OpenAPI YAML | https: // localhost: 8000/schema/openapi.yaml |
| Skema OpenAPI JSON | https: // localhost: 8000/schema/openapi.json |
GET /generate - Hasilkan audio dalam format WAV dari teks. Parameter: text speaker sample_rate , pitch , rateGET /speakers - Dapatkan Daftar Pembicara sample_rate dapat diatur dari 8 000, 24 000, 48 000 pitch dan rate dapat diatur dari 0 hingga 100
TEXT_LENGTH_LIMIT - Panjang maksimum teks yang akan diproses. Default adalah 930 karakter.MKL_NUM_THREADS - Jumlah utas yang akan digunakan untuk menghasilkan audio. Jumlah utas default: Jumlah inti CPU.Repositori ini didedikasikan untuk twir.app dan dirancang untuk memenuhi persyaratannya.
TwirApp perlu menghasilkan audio menggunakan CPU. Jika dukungan untuk perangkat lain seperti CUDA atau MPS diperlukan, silakan buka masalah.