Unduh silero tts api server - Unduh Kode Sumber Sumber silero tts api server

Unduh

Spanduk

Bahasa didukung

Catatan

Semua model berasal dari repositori: snakers4/silero-model

Bahasa	Model	Pembicara
Rusia	v4_ru	5: Aidar, Baya, Kseniya, Xenia, Eugene
Ukraina	v4_ua	1: Mykyta
Uzbek	v4_uz	1: Dilnavoz
Bahasa inggris	v3_en	118: en_0, en_1, ..., en_117
Spanyol	v3_es	3: ES_0, ES_1, ES_2
Perancis	v3_fr	6: FR_0, FR_1, FR_2, FR_3, FR_4, FR_5
Jerman	v3_de	5: Bernd_ungerer, Eva_K, Friedrich, Hokuspokus, Karlsson
Tatar	v3_tt	1: Dilyara
Mongolia	v3_xal	2: Erdni, Delghir

Penting

Ini membutuhkan Docker Installed dan Docker Daemon Running

docker run --rm -p 8000:8000 twirapp/silero-tts-api-server

Bangun dan jalankan dari repositori lokal

Klon Repositori:

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Bangun Gambar Docker:

docker build -f docker/Dockerfile -t silero-tts-api-server .

Jalankan wadah:

docker run --rm -p 8000:8000 silero-tts-api-server

Atau gunakan Docker Compose:

docker-compose -f docker/compose.yml up

Penting

Persyaratan Minimum Python 3.9

Proyek ini menggunakan gandum hitam untuk manajemen ketergantungan, ia mengasumsikan Anda telah menginstalnya

Klon Repositori

git clone https://github.com/twirapp/silero-tts-api-server.git && cd silero-tts-api-server

Catatan

Defaultnya adalah localhost: 8000

Anda dapat melihat dokumentasi yang dihasilkan secara otomatis berdasarkan OpenAPI di:

Penyedia	Url
Menyombongkan	https: // localhost: 8000/skema/
Redoc	https: // localhost: 8000/skema/redoc
Elemen lampu lalu lintas	https: // localhost: 8000/skema/elemen
Repidoc	https: // localhost: 8000/skema/repidoc
Skema OpenAPI YAML	https: // localhost: 8000/schema/openapi.yaml
Skema OpenAPI JSON	https: // localhost: 8000/schema/openapi.json

GET /generate - Hasilkan audio dalam format WAV dari teks. Parameter: text speaker sample_rate , pitch , rate
GET /speakers - Dapatkan Daftar Pembicara

sample_rate dapat diatur dari 8 000, 24 000, 48 000 pitch dan rate dapat diatur dari 0 hingga 100

TEXT_LENGTH_LIMIT - Panjang maksimum teks yang akan diproses. Default adalah 930 karakter.
MKL_NUM_THREADS - Jumlah utas yang akan digunakan untuk menghasilkan audio. Jumlah utas default: Jumlah inti CPU.