Perpustakaan Python sederhana untuk mengonversi teks-ke-speech (TTS) Sanskerta. Mesin TTS yang didukung adalah:
Kedua opsi API ini memerlukan otentikasi, dalam bentuk kredensial Google Cloud, atau kunci API Bhashini. Pengembang Bhashini dengan murah hati menyediakan kunci API untuk penggunaan API yang tidak komersial dan terbatas untuk membuat audio teks Sanskerta. Ini dapat digunakan melalui proxy bhashini (lihat penggunaan di bawah). Harap dicatat bahwa proxy bhashini (opsi default) tidak boleh digunakan untuk tujuan lain.
Paket ini menggunakan pydub untuk mengelola data audio, yang pada gilirannya membutuhkan ffmpeg atau libav . Silakan periksa detailnya (di sini) [https://github.com/jiaaro/pydub#dependencies].
Paket ini harus berfungsi dengan versi Python> = 3.8.
pip install sanskrit_ttsUntuk menginstal dari cabang utama repo git:
pip install git+https://github.com/avinashvarna/sanskrit_tts.gitUntuk instalasi yang dapat diedit (untuk memodifikasi kode dan bereksperimen)
git clone https://github.com/avinashvarna/sanskrit_tts.git
cd sanskrit_tts
pip install -e . Semua kelas TTS mengekspos antarmuka yang sama, sehingga switching harus cukup mudah.
from sanskrit_tts import default_tts
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = default_tts ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" ) from sanskrit_tts . bhashini_tts import BhashiniTTS
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
api_key = ...
TTS = BhashiniTTS ( api_key = api_key )
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Membutuhkan kredensial, misalnya dari (akun layanan) [https://cloud.google.com/iam/docs/creating-managing-service-accounts].
import os
from sanskrit_tts . gcloud_tts import GCloudTTS
# Setup credentials
os . environ [ 'GOOGLE_APPLICATION_CREDENTIALS' ] = './credentials.json'
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = GCloudTTS ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Baik Google Cloud TTS dan Bhashini Text-to-Speech belum mendukung bahasa Sansekerta. Sebagai solusi, perpustakaan ini menggunakan bahasa lain untuk konversi pidato ke teks. Kannada digunakan secara default untuk solusi ini. Bahasa/suara lain yang didukung oleh API TTS yang sesuai dapat digunakan dengan mengubah parameter yang sesuai saat instantiasi kelas TTS, dan hasilnya akan bervariasi. Daftar lengkap suara yang didukung oleh Google Cloud TTS tersedia di sini. Untuk bhashini, silakan periksa (demo) [https://tts.bhashini.ai/demo/].