DeepConvolutionalTTS pytorch
1.0.0
上記のデータセットをダウンロードして、config.pyのパスを変更します。次に、以下のコマンドを実行します。第1 arg:信号pretro、2番目のarg:メタデータ(列車/テストの分割)
python prepro.py 1 1
DCTTSには2つのモデルがあります。まず、モデルText2Melをトレーニングする必要があります。 20kステップで十分だと思います(たった1時間)。ただし、衰退したガイド付き注意損失でモデルをますますトレーニングする必要があります。
python train.py 1 <gpu_id>
第二に、SSRNを訓練します。 SSRNの出力は多くの高解像度データです。したがって、SSRNのトレーニングはText2Melのトレーニングよりも遅いです
python train.py 2 <gpu_id>
トレーニング後、テキストからのスピーチを合成できます。
python synthesize.py <gpu_id>
