Unduh tts api - Unduh Kode Sumber tts api

tts api

Kode Sumber AI

v2.6.1

Unduh

TTS-API

API REST TEKS UNTUK PUSTAK UNTUK UNTUK MENGUBAH TTS TTS.

Anda dapat mengirim teks untuk dikonversi menjadi audio, menggunakan mesin TTS yang berbeda dan efek suara. Kemudian, Anda akan mendengarkannya di perangkat audio lokal Anda, atau menerima file audio yang dihasilkan.

Pengaturan

Pertama, Anda harus menginstal mesin TTS yang didukung:

Pengaturan Googlespeech

apt install python3 sox libsox-fmt-mp3
pip install google_speech

Pengaturan GTTS

apt install python3 sox libsox-fmt-mp3
pip install gTTS

Pengaturan Festival

apt install festival festvox-ellpc11k

Pengaturan Espeak

apt install espeak

Anda juga perlu menginstal NodeJs dan NPM , dan kemudian, cukup jalankan npm install dan npm start . API sekarang harus berjalan di http://localhost:3000 .

Atau Anda bisa menggunakan gambar Docker PEDROETB/TTS-API, yang sudah memiliki semua dependensi yang dikonfigurasi.

Siapkan menggunakan Docker

Satu -satunya persyaratan adalah memasang Docker . Lalu, Anda dapat menjalankan:

docker run --rm -d --name tts-api --device /dev/snd -p 3000:3000 pedroetb/tts-api

API akan berjalan dan dapat diakses di http://localhost:3000 .

Atau, Anda dapat menggunakannya di cluster Swarm Docker menggunakan docker compose (sudah termasuk dalam Docker jika menggunakan versi modern) dan docker swarm (Buat Swarm Cluster First):

 cd deploy

# Deploy Caddy service
env $( grep -v ' ^[#| ] ' .env | xargs ) 
 TRAEFIK_DOMAIN=change.me 
 docker stack deploy 
 -c compose.caddy.yaml 
 tts-api

# Run TTS-API container
docker compose 
 -f compose.tts-api.yaml 
 -p tts-api 
 up -d

Layanan ini disiapkan untuk direverse-proxied dengan Traefik , dan dapat diakses di tts.${TRAEFIK_DOMAIN} domain. Cara menjalankan Traefik tidak dijelaskan di sini, periksa situs resminya.

Proxy membutuhkan sedikit bantuan dari Caddy , karena Docker Swarm tidak kompatibel dengan konfigurasi perangkat (diperlukan untuk menggunakan kemampuan suara) dan Traefik tidak dapat bekerja dengan wadah Docker dan layanan Docker Swarm sekaligus. Dengan cara ini, hanya layanan caddy yang diekspos menggunakan wadah TRAEFIK dan tts-api hanya dapat diakses melalui proxy terbalik yang disediakan oleh Caddy (cara yang sama Traefik merenungkan caddy ).

Keduanya, Docker Container dan Service, dapat berjalan pada host yang berbeda, karena mereka dapat berkomunikasi melalui jaringan overlay Docker. Jalankan wadah Docker tts-api di host yang memiliki speaker, sehingga Anda dapat mendengarkan pidato.

Jangan lupa untuk mengedit variabel lingkungan TRAEFIK_DOMAIN sebelum digunakan.

Penggunaan

Saat berjalan, API akan menerima permintaan pos di http://localhost:3000 . Anda dapat menggunakan klien REST favorit Anda untuk mengirim permintaan, atau menggunakan formulir bawaan.

Kedua mode (bermain atau mengunduh audio) tersedia menggunakan kode suara yang berbeda, pilih satu sesuai dengan kebutuhan Anda.

Bentuk bawaan

Buka http://localhost:3000 dengan browser Anda, isi formulir dengan data dan kirimkan. Hanya itu.

Kirim permintaan pos

Anda dapat mengirim permintaan posting ke http://localhost:3000 mengikuti skema ini:

Header
- Jenis Konten : application/json
Tubuh
- { "voice": "google_speech", "textToSpeech": "hello world", "language": "en", "speed": "1" }

Misalnya, menggunakan curl :

 # Play audio
curl http://localhost:3000 
 -d ' { "voice": "google_speech", "textToSpeech": "hello world", "language": "en", "speed": "1" } ' 
 -H ' Content-Type: application/json '

# Download audio file
curl http://localhost:3000 
 -d ' { "voice": "gtts_file", "textToSpeech": "hello world", "language": "en", "speed": "1" } ' 
 -H ' Content-Type: application/json ' 
 -o ' output.mp3 '

Mesin TTS yang tersedia

Mesin Googlespeech

Google Speech adalah alat baris perintah multiplatform sederhana untuk membaca teks menggunakan Google Translate TTS (Teks ke Pidato) API.

Anda harus online untuk berkomunikasi dengan Google Server.

Pelajari lebih lanjut di https://github.com/desbma/googlespeech

Mesin GTTS

Google Text-to-Speech (GTTS) adalah pustaka Python dan alat CLI untuk berinteraksi dengan API teks-ke-speech Google Translate.

Anda harus online untuk berkomunikasi dengan Google Server.

Pelajari lebih lanjut di https://github.com/pndurette/gtts

Mesin festival

Festival adalah meja kerja sintesis multi-bahasa perangkat lunak gratis yang berjalan pada banyak platform yang menawarkan teks kotak hitam untuk berbicara, serta arsitektur terbuka untuk penelitian dalam sintesis ucapan.

Itu bekerja offline.

Pelajari lebih lanjut di http://www.cstr.ed.ac.uk/projects/festival/ dan http://festvox.org/festival/