Sayitは、書かれたテキストと発音するクロスプラットフォームのコマンドラインツールです。それを使用して、テキストファイルのオーディオ録音を作成したり、外国語で発音を改善したりできます。
Sayitは、Azure Cognitive Servicesをバックエンドとして使用して、最適なオーディオ品質を保証するため、Azureのサブスクリプションが必要です。これはここで無料で入手できます。 Azure Cognitive Services Free Tierは、2021年の時点で、1か月あたり5時間のテキスト間時間が含まれています。
SayITをリリースセクションにダウンロードできます。 Sayitは現在、自己完結型の.NET実行可能ファイル(使用するために.NETランタイムをインストールする必要はない)とフレームワーク依存の.NET実行可能ファイルとして配布されています。
最初に使用すると、セットアップウィザード( ./sayit --setup )を実行し、サブスクリプションキー(Azureポータルで見つけることができる)や地域識別子(こちらを参照)などのAzure Cognitive Servicesリソースの構成パラメーターを入力する必要があります。 Sayitは、これらのパラメーターを、現在のユーザーの構成フォルダー(例~/.config/ in linux)にXMLファイルを設定するアプリとして保存します。
$ ./sayit --help
USAGE: sayit [--help] [--version] [--setup] [--list-voices] [--list-formats]
[--voice <voice>] [--format <format>] [--output <output>] [<input>]
INPUT:
<input> the text to be pronounced
(if missing, sayit will try to read it from stdin)
OPTIONS:
--version print sayit version
--setup setup the configuration file
--list-voices, -lv list the available voice shorthands
with their corresponding voice ids
--list-formats, -lf list the available output format shorthands
with their corresponding output format ids
--voice, -v <voice> the voice shorthand
--format, -f <format> the audio output format shorthand
--output, -o <output> the path of the output file
--help display this list of options.
Sayitはこれらの設定をサポートしています:
audio-16khz-32kbitrate-mono-mp3 、 audio-16khz-64kbitrate-mono-mp3 、 audio-16khz-128kbitrate-mono-mp3 、 audio-24khz-96kbitrate-mono-mp3 、 audio-24khz-160kbitrate-mono-mp3 audio-24khz-48kbitrate-mono-mp3 、 riff-8khz-16bit-mono-pcm 、 riff-16khz-16bit-mono-pcm 、 riff-24khz-16bit-mono-pcm 。NB:一部の言語および出力形式は、その地域に応じて、Azure Cognitive Servicesリソースによってサポートされていない場合があります(こちらを参照)。
NB:サポートされている声とフォーマットの選択はややランダムです。もちろん、提案や貢献を歓迎します。