サンスクリット語のテキストからスピーチ(TTS)を変換するためのシンプルなPythonライブラリ。サポートされているTTSエンジンは次のとおりです。
これらのAPIオプションは両方とも、Google Cloud資格情報またはBhashini APIキーの形で認証が必要です。 Bhashiniの開発者は、Sanskritテキストのオーディオを作成するための非営利的で制限されたAPIのAPIキーをgeneしみなく提供しました。これは、Bhashini Proxyを介して使用できます(以下の使用法を参照)。 Bhashini Proxy(デフォルトオプション)は、他の目的に使用しないでください。
このパッケージでは、 pydubを使用してオーディオデータを管理し、 ffmpegまたはlibav必要です。詳細(こちら)[https://github.com/jiaaro/pydub#dependencies]を確認してください。
このパッケージは、Python> = 3.8の任意のバージョンで動作するはずです。
pip install sanskrit_ttsGit Repoのマスターブランチからインストールするには:
pip install git+https://github.com/avinashvarna/sanskrit_tts.git編集可能なインストールの場合(コードと実験を変更するため)
git clone https://github.com/avinashvarna/sanskrit_tts.git
cd sanskrit_tts
pip install -e . すべてのTTSクラスは同じインターフェイスを公開するため、切り替えはかなり簡単です。
from sanskrit_tts import default_tts
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = default_tts ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" ) from sanskrit_tts . bhashini_tts import BhashiniTTS
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
api_key = ...
TTS = BhashiniTTS ( api_key = api_key )
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )例えば、(サービスアカウント)[https://cloud.google.com/iam/docs/creating-managing-service-accounts]からの資格情報が必要です。
import os
from sanskrit_tts . gcloud_tts import GCloudTTS
# Setup credentials
os . environ [ 'GOOGLE_APPLICATION_CREDENTIALS' ] = './credentials.json'
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = GCloudTTS ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Google Cloud TTSとBhashiniのテキストからスピーチの両方は、サンスクリット語をまだサポートしていません。回避策として、このライブラリは他の言語を使用してスピーチからテキスト変換を行います。カンナダは、この回避策にデフォルトで使用されます。対応するTTS APIによってサポートされる他の言語/音声は、TTSクラスをインスタンス化しながら適切なパラメーターを変更することで使用でき、結果は異なります。 Google Cloud TTSがサポートする声の完全なリストはこちらから入手できます。 Bhashiniについては、(demo)[https://tts.bhashini.ai/demo/]を確認してください。