Uma biblioteca simples do Python para converter o texto em sânscrito em fala (TTS). Os motores TTS suportados são:
Ambas as opções de API requerem autenticação, na forma de credenciais do Google Cloud, ou a chave da API da Bhashini. Os desenvolvedores da Bhashini forneceram generosamente uma chave de API para uso limitado e não comercial da API para criar áudio de textos sânscrito. Isso pode ser usado através do proxy da Bhashini (veja o uso abaixo). Observe que o proxy da Bhashini (a opção padrão) não deve ser usada para outros fins.
Este pacote usa pydub para gerenciar dados de áudio, que por sua vez requer ffmpeg ou libav . Por favor, verifique os detalhes (aqui) [https://github.com/jiaaro/pydub#dependências].
Este pacote deve funcionar com qualquer versão do Python> = 3.8.
pip install sanskrit_ttsPara instalar na filial mestre do Repo Git:
pip install git+https://github.com/avinashvarna/sanskrit_tts.gitPara uma instalação editável (para modificar o código e o experimento)
git clone https://github.com/avinashvarna/sanskrit_tts.git
cd sanskrit_tts
pip install -e . Todas as classes TTS expõem a mesma interface, para que a comutação seja bastante fácil.
from sanskrit_tts import default_tts
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = default_tts ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" ) from sanskrit_tts . bhashini_tts import BhashiniTTS
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
api_key = ...
TTS = BhashiniTTS ( api_key = api_key )
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Requer credenciais, por exemplo, de uma (conta de serviço) [https://cloud.google.com/iam/docs/creating-managing-service-accounts].
import os
from sanskrit_tts . gcloud_tts import GCloudTTS
# Setup credentials
os . environ [ 'GOOGLE_APPLICATION_CREDENTIALS' ] = './credentials.json'
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = GCloudTTS ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )O Google Cloud TTS e o Bhashini Text-to -peel ainda não suportam sânscrito. Como solução alternativa, esta biblioteca usa outros idiomas para a conversão de fala para texto. Kannada é usado por padrão para esta solução alternativa. Qualquer outra linguagem/voz suportada pela API TTS correspondente pode ser usada alterando os parâmetros apropriados enquanto instanciava a classe TTS e os resultados variarão. Uma lista completa de vozes suportadas pelo Google Cloud TTS está disponível aqui. Para Bhashini, verifique a (demonstração) [https://tts.bhashini.ai/demo/].