AiVoice
1.0.0
这是深度语音3:2000扬声器神经文本到语音的张量实现。目前,我们只是专注于单扬声器的综合。
LJ语音数据集
下载并解开LJ语音数据集。跑步:
python prepro.py
注意:请确保我们将数据集解压缩到prepro.py的同一foler中。
之后,我们将获得三个新文件夹:
├── dones [New]
├── mags [New]
├── mels [New]
├── metadata.csv
├── README
└── wavs
./LJSpeech-1.0/mags数据从./LJSpeech-1.0/metadata.csv ./LJSpeech-1.0/mels ./LJSpeech-1.0/dones 。如果我们想更改加载路径,我们可以更改class Hyperparams中的配置。
要训练模型,我们使用此命令:
python train.py
目前,我们无法取得好成绩。但是,我们仍然提供我们的预培训模型,以防有人对此感兴趣。
预训练模型。
它的注意数如下:
在训练中产生的所有注意数字都包含在预训练的模型zpiped文件中。
大部分代码都是从Kyubyong/DeepVoice3借来的。