API REST TEKS UNTUK PUSTAK UNTUK UNTUK MENGUBAH TTS TTS.
Anda dapat mengirim teks untuk dikonversi menjadi audio, menggunakan mesin TTS yang berbeda dan efek suara. Kemudian, Anda akan mendengarkannya di perangkat audio lokal Anda, atau menerima file audio yang dihasilkan.
Pertama, Anda harus menginstal mesin TTS yang didukung:
apt install python3 sox libsox-fmt-mp3
pip install google_speechapt install python3 sox libsox-fmt-mp3
pip install gTTSapt install festival festvox-ellpc11kapt install espeak Anda juga perlu menginstal NodeJs dan NPM , dan kemudian, cukup jalankan npm install dan npm start . API sekarang harus berjalan di http://localhost:3000 .
Atau Anda bisa menggunakan gambar Docker PEDROETB/TTS-API, yang sudah memiliki semua dependensi yang dikonfigurasi.
Satu -satunya persyaratan adalah memasang Docker . Lalu, Anda dapat menjalankan:
docker run --rm -d --name tts-api --device /dev/snd -p 3000:3000 pedroetb/tts-api API akan berjalan dan dapat diakses di http://localhost:3000 .
Atau, Anda dapat menggunakannya di cluster Swarm Docker menggunakan docker compose (sudah termasuk dalam Docker jika menggunakan versi modern) dan docker swarm (Buat Swarm Cluster First):
cd deploy
# Deploy Caddy service
env $( grep -v ' ^[#| ] ' .env | xargs )
TRAEFIK_DOMAIN=change.me
docker stack deploy
-c compose.caddy.yaml
tts-api
# Run TTS-API container
docker compose
-f compose.tts-api.yaml
-p tts-api
up -d Layanan ini disiapkan untuk direverse-proxied dengan Traefik , dan dapat diakses di tts.${TRAEFIK_DOMAIN} domain. Cara menjalankan Traefik tidak dijelaskan di sini, periksa situs resminya.
Proxy membutuhkan sedikit bantuan dari Caddy , karena Docker Swarm tidak kompatibel dengan konfigurasi perangkat (diperlukan untuk menggunakan kemampuan suara) dan Traefik tidak dapat bekerja dengan wadah Docker dan layanan Docker Swarm sekaligus. Dengan cara ini, hanya layanan caddy yang diekspos menggunakan wadah TRAEFIK dan tts-api hanya dapat diakses melalui proxy terbalik yang disediakan oleh Caddy (cara yang sama Traefik merenungkan caddy ).
Keduanya, Docker Container dan Service, dapat berjalan pada host yang berbeda, karena mereka dapat berkomunikasi melalui jaringan overlay Docker. Jalankan wadah Docker tts-api di host yang memiliki speaker, sehingga Anda dapat mendengarkan pidato.
Jangan lupa untuk mengedit variabel lingkungan TRAEFIK_DOMAIN sebelum digunakan.
Saat berjalan, API akan menerima permintaan pos di http://localhost:3000 . Anda dapat menggunakan klien REST favorit Anda untuk mengirim permintaan, atau menggunakan formulir bawaan.
Kedua mode (bermain atau mengunduh audio) tersedia menggunakan kode suara yang berbeda, pilih satu sesuai dengan kebutuhan Anda.
Buka http://localhost:3000 dengan browser Anda, isi formulir dengan data dan kirimkan. Hanya itu.
Anda dapat mengirim permintaan posting ke http://localhost:3000 mengikuti skema ini:
application/json{ "voice": "google_speech", "textToSpeech": "hello world", "language": "en", "speed": "1" } Misalnya, menggunakan curl :
# Play audio
curl http://localhost:3000
-d ' { "voice": "google_speech", "textToSpeech": "hello world", "language": "en", "speed": "1" } '
-H ' Content-Type: application/json '
# Download audio file
curl http://localhost:3000
-d ' { "voice": "gtts_file", "textToSpeech": "hello world", "language": "en", "speed": "1" } '
-H ' Content-Type: application/json '
-o ' output.mp3 ' Google Speech adalah alat baris perintah multiplatform sederhana untuk membaca teks menggunakan Google Translate TTS (Teks ke Pidato) API.
Anda harus online untuk berkomunikasi dengan Google Server.
Pelajari lebih lanjut di https://github.com/desbma/googlespeech
Google Text-to-Speech (GTTS) adalah pustaka Python dan alat CLI untuk berinteraksi dengan API teks-ke-speech Google Translate.
Anda harus online untuk berkomunikasi dengan Google Server.
Pelajari lebih lanjut di https://github.com/pndurette/gtts
Festival adalah meja kerja sintesis multi-bahasa perangkat lunak gratis yang berjalan pada banyak platform yang menawarkan teks kotak hitam untuk berbicara, serta arsitektur terbuka untuk penelitian dalam sintesis ucapan.
Itu bekerja offline.
Pelajari lebih lanjut di http://www.cstr.ed.ac.uk/projects/festival/ dan http://festvox.org/festival/
Espeak adalah Synthesizer Pidato Perangkat Lunak Open Source yang ringkas untuk bahasa Inggris dan bahasa lainnya, untuk Linux dan Windows.
Itu bekerja offline.
Pelajari lebih lanjut di http://espeak.sourceForge.net/
Proyek ini dirilis di bawah lisensi MIT.