Transformer TTS
1.0.0

pip install -r requirements.txt





您可以在下面检查一些生成的样本。所有样本均以160K的速度步进,因此我认为该模型尚未融合。在长句子中,该模型似乎是较低的性能。
第一个图是预测的MEL频谱图,第二个是地面真相。


hyperparams.py包含所有需要的超级参数。prepare_data.py预处理wav文件到MEL,线性光谱图并保存它们以获取更快的训练时间。文本的预处理代码在文本/目录中。preprocess.py包括所有预处理代码。module.py包含所有方法,包括注意力,Prenet,Postnet等。network.py包含网络,包括编码器,解码器和后处理网络。train_transformer.py用于培训自回旋的注意力网络。 (文字 - > mel)train_postnet.py用于培训后网络。 (梅尔 - >线性)synthesis.py用于生成TTS样品。 hyperparams.py中调整超参数,尤其是“ data_path”,这是您提取文件的目录,以及如有必要的目录。prepare_data.py 。train_transformer.py 。train_postnet.py 。 synthesis.py 。确保还原步骤。