貢献は大歓迎です!貢献ガイドを確認してください。
TTS-Wrapperは、統一された使いやすいインターフェイスを提供することにより、テキストからスピーチのAPIを使いやすくします。
現在、次のサービスがサポートされています。
PIPを使用してインストールします。
pip install TTS-Wrapper注:使用するサービスごとに、必要なパッケージをインストールする必要があります。
例: googleとwatson使用するには:
pip install TTS-Wrapper[google, watson] Picottsの場合、マシンにパッケージをインストールする必要があります。 Debian(Ubuntuなど)には、 libttspico-utilsをパッケージにインストールし、Arch(Manjaroなど)にはaur/pico-ttsと呼ばれるパッケージがあります。
目的のサービスからオブジェクトをインスタンス化するだけで、 synth()を呼び出します。
from tts_wrapper import PollyTTS , PollyClient
tts = PollyTTS ( client = PollyClient ())
tts . synth ( '<speak>Hello, world!</speak>' , 'hello.wav' )サービスで動作するためにクライアントオブジェクトを作成する必要があることに注意してください。各サービスは、異なる承認手法を使用します。詳細については、ドキュメントをご覧ください。
このようにデフォルトの音声とLangを変更できます。
PollyTTS ( voice = 'Camila' , lang = 'pt-BR' )Polly、Google、Microsoft、およびWatsonの利用可能な声のリストをご覧ください。
SSMLマークアップを使用して、互換性のあるエンジンの出力を制御することもできます。
tts . synth ( '<speak>Hello, <break time="3s"/> world!</speak>' , 'hello.wav' )各エンジンの正しいボイラープレートタグを作成するssml属性を使用することをお勧めします。
tts . synth ( tts . ssml . add ( 'Hello, <break time="3s"/> world!' ), 'hello.wav' )各サービスで使用できるタグを学びます:Polly、Google、Microsoft、およびWatson。
各エンジンにアクセスするための資格情報をセットアップするには、それぞれのクライアントを作成します。
資格情報を明示的に定義しない場合、 boto3システムの資格情報ファイルまたは環境変数でそれらを見つけようとします。ただし、タプルで指定できます。
from tts_wrapper import PollyClient
client = PollyClient ( credentials = ( region , aws_key_id , aws_access_key ))OAUTH 2.0資格情報ファイルパスを指します。
from tts_wrapper import GoogleClient
client = GoogleClient ( credentials = 'path/to/creds.json' )サブスクリプションキーを提供するだけです。
from tts_wrapper import MicrosoftClient
client = MicrosoftClient ( credentials = 'TOKEN' )お住まいの地域がデフォルトの「useast」でない場合は、そのように変更できます。
client = MicrosoftClient ( credentials = 'TOKEN' , region = 'brazilsouth' )APIキーを渡し、URLを初期化に渡します。
from tts_wrapper import WatsonClient
client = WatsonClient ( credentials = ( 'API_KEY' , 'API_URL' ))これらのクライアントは、オフラインで実行されるため、承認を必要としません。
from tts_wrapper import PicoClient , SAPIClient
client = PicoClient ()
# or
client = SAPIClient ()デフォルトでは、すべてのオーディオはWaveファイルになりますが、 formatオプションを使用してMP3に変更できます。
tts . synth ( '<speak>Hello, world!</speak>' , 'hello.mp3' , format = ' mp3 )MITライセンスに基づいてライセンスされています。