Eine einfache Python-Bibliothek zum Konvertieren von Sanskrit Text-to-Speech (TTS). Die unterstützten TTS -Motoren sind:
Beide API -Optionen erfordern eine Authentifizierung in Form von Google Cloud -Anmeldeinformationen oder Bhashini -API -Schlüssel. Die Entwickler von Bhashini haben großzügig einen API-Schlüssel für nichtkommerzielle, eingeschränkte Verwendung der API zur Erstellung von Audio von Sanskrit-Texten bereitgestellt. Dies kann über den Bhashini -Proxy verwendet werden (siehe Verwendung unten). Bitte beachten Sie, dass der Bhashini -Proxy (die Standardoption) nicht für andere Zwecke verwendet werden sollte.
Dieses Paket verwendet pydub zum Verwalten von Audiodaten, was wiederum ffmpeg oder libav erfordert. Bitte überprüfen Sie die Details (hier) [https://github.com/jiaaro/pydub#dependenzen].
Dieses Paket sollte mit jeder Version von Python> = 3.8 funktionieren.
pip install sanskrit_ttsSo installieren Sie aus dem Master -Zweig des Git Repo:
pip install git+https://github.com/avinashvarna/sanskrit_tts.gitFür eine bearbeitbare Installation (um den Code und das Experiment zu ändern)
git clone https://github.com/avinashvarna/sanskrit_tts.git
cd sanskrit_tts
pip install -e . Alle TTS -Klassen legen dieselbe Schnittstelle frei, sodass das Schalten ziemlich einfach sein sollte.
from sanskrit_tts import default_tts
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = default_tts ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" ) from sanskrit_tts . bhashini_tts import BhashiniTTS
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
api_key = ...
TTS = BhashiniTTS ( api_key = api_key )
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Erfordert Anmeldeinformationen, z. B. aus einem (Service-Konto) [https://cloud.google.com/iam/docs/creating-managing-service-counts].
import os
from sanskrit_tts . gcloud_tts import GCloudTTS
# Setup credentials
os . environ [ 'GOOGLE_APPLICATION_CREDENTIALS' ] = './credentials.json'
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = GCloudTTS ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Sowohl Google Cloud TTS als auch Bhashini Text-to-Speech unterstützen Sanskrit noch nicht. Als Problemumgehung verwendet diese Bibliothek andere Sprachen zur Reversion zur Sprache zum Text. Kannada wird für diese Problemumgehung standardmäßig verwendet. Jede andere Sprache/Stimme, die von der entsprechenden TTS -API unterstützt wird, kann durch Ändern der entsprechenden Parameter beim Instanziieren der TTS -Klasse verwendet werden, und die Ergebnisse variieren. Eine vollständige Liste der von Google Cloud TTS unterstützten Stimmen finden Sie hier. Für Bhashini überprüfen Sie bitte die (Demo) [https://tts.bhashini.ai/demo/].