dctts pytorch
1.0.0
Pytorch实施爸爸的实施有效地基于深层卷积网络,具有指导性的注意力。
感谢Kyubyong/DC_TTS,这有助于我克服一些困难。
我已经调整了超级参数,并使用LJ语音数据集训练了模型。超级参数可能不是最好的参数,并且与原始纸张中使用的参数略有不同。
使用LJ语音数据集训练模型:
pkg/hyper.py设置目录 python3 main.py --action preprocess
pkg/hyper.py的text2mel python3 main.py --action train --module Text2Mel
python3 main.py --action train --module SuperRes
一些合成样品包含在目录synthesis中。根据句子列出了sentences.txt 。合成时,合成时将加载text2mel和超级训练的预训练模型(在logdir/text2mel/pkg/trained.pkg和logdir/superres/pkg/trained.pkg的训练阶段的自动保存)时加载。
您可以在sentences.txt中列出的样本。
python3 main.py --action synthesis

目录synthesis中的样品用410k批次训练的Text2Mel和190K批次训练的超级批次采样。
当前的结果不是很令人满意,通常会跳过一些元音。希望有人可以找到更好的超级参数并训练更好的模型。请告诉我,您是否能够获得出色的模型。
您可以从我的Dropbox下载当前的预训练模型。
TensorFlow实现:Kyubyong/DC_TTS
如果您有任何疑问或建议,请给我发电子邮件或打开问题。