Простая библиотека Python для преобразования санскритского текста в речь (TTS). Поддерживаемые двигатели TTS:
Оба эти параметра API требуют аутентификации в виде учетных данных Google Cloud или ключа API Bhashini. Разработчики Bhashini щедро предоставили API-ключ для некоммерческого, ограниченного использования API для создания аудио санскритских текстов. Это может быть использовано через прокси -сервер Bhashini (см. Использование ниже). Обратите внимание, что прокси -сервер Bhashini (опция по умолчанию) не следует использовать для других целей.
В этом пакете используется pydub для управления аудиодадами, которые, в свою очередь, требуют ffmpeg или libav . Пожалуйста, проверьте подробности (здесь) [https://github.com/jiaaro/pydub#dependencies].
Этот пакет должен работать с любой версией Python> = 3.8.
pip install sanskrit_ttsЧтобы установить из главной ветви GIT Repo:
pip install git+https://github.com/avinashvarna/sanskrit_tts.gitДля редактируемой установки (для изменения кода и эксперимента)
git clone https://github.com/avinashvarna/sanskrit_tts.git
cd sanskrit_tts
pip install -e . Все классы TTS разоблачают один и тот же интерфейс, так что переключение должно быть довольно простым.
from sanskrit_tts import default_tts
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = default_tts ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" ) from sanskrit_tts . bhashini_tts import BhashiniTTS
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
api_key = ...
TTS = BhashiniTTS ( api_key = api_key )
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Требуется учетные данные, например, от (Сервисная учетная запись) [https://cloud.google.com/iam/docs/creating- Madaging-service-accounts].
import os
from sanskrit_tts . gcloud_tts import GCloudTTS
# Setup credentials
os . environ [ 'GOOGLE_APPLICATION_CREDENTIALS' ] = './credentials.json'
text = "तैत्तिरीयोपनिषत् प्रसिद्धासु दशसु उपनिषत्सु अन्यतमा ।"
TTS = GCloudTTS ()
audio = TTS . synthesize ( text )
# Export the audio as an MP3
audio . export ( "sanskrit_speech.mp3" )Как Google Cloud TTS, так и Bhashini Text-To Speek еще не поддерживают санскрит. В качестве обходного пути, эта библиотека использует другие языки для преобразования речи в текстовое преобразование. Каннада используется по умолчанию для этого обходного пути. Любой другой язык/голос, поддерживаемый соответствующим API TTS, может использоваться путем изменения соответствующих параметров при создании класса TTS, и результаты будут варьироваться. Полный список голосов, поддерживаемых Google Cloud TTS, доступен здесь. Для Bhashini, пожалуйста, проверьте (демо) [https://tts.bhashini.ai/demo/].