Transformer TTS
1.0.0

pip install -r requirements.txt





以下の生成されたサンプルを確認できます。すべてのサンプルは160kのステップであるため、モデルはまだ収束していないと思います。このモデルは、長い文のパフォーマンスが低いようです。
最初のプロットは予測されたMELスペクトログラムで、2つ目はグラウンドトゥルースです。


hyperparams.pyには、必要なすべてのハイパーパラメーターが含まれています。prepare_data.py preprocess wavファイルはmel、線形スペクトログラムにファイルを送り、より速いトレーニング時間のためにそれらを保存します。テキストの前処理コードはテキスト/ディレクトリにあります。preprocess.pyは、データをロードするときにすべての前処理コードが含まれます。module.pyには、注意、プレネット、ポストネットなどのすべての方法が含まれています。network.pyには、エンコーダー、デコーダー、ポストプロセッシングネットワークなどのネットワークが含まれています。train_transformer.pyは、オートレーフオーテストアテンションネットワークをトレーニングするためのものです。 (テキスト - >メル)train_postnet.pyは、ポストネットワークをトレーニングするためのものです。 (メル - >線形)synthesis.pyは、TTSサンプルを生成するためのものです。 hyperparams.py 、特にファイルを抽出するディレクトリである「data_path」、および必要に応じてその他を調整します。prepare_data.pyします。train_transformer.pyします。train_postnet.py実行します。 synthesis.pyします。復元ステップを確認してください。