DeepConvolutionalTTS pytorch
1.0.0
下载上面的数据集并在config.py中修改路径。然后运行以下命令。第1 arg:信号prepro,第二个arg:元数据(火车/测试拆分)
python prepro.py 1 1
DCTT有两个模型。首先,您应该训练Model Text2Mel。我认为20K步骤就足够了(仅一个小时)。但是,您应该越来越多地训练该模型,而引导的注意力丧失。
python train.py 1 <gpu_id>
其次,训练SSRN。 SSRN的输出是许多高分辨率数据。因此,培训SSRN比训练Text2Mel慢
python train.py 2 <gpu_id>
训练后,您可以从文本中综合一些语音。
python synthesize.py <gpu_id>
