Tacotron pytorch
1.0.0
Tacotron的Pytorch实现:完全端到端的文本到语音合成模型。

pip install -r requirements.txt
我使用了由文本脚本和WAV文件对组成的LJSpeech数据集。可以在此处下载完整的数据集(13,100对)。我推荐了https://github.com/keithito/tacotron以进行预处理代码。
hyperparams.py包含所有需要的超级参数。data.py将培训数据和预处理文本加载到索引和WAV文件以进行频谱图。文本的预处理代码在文本/目录中。module.py包含所有方法,包括CBHG,Highway,Prenet等。network.py包含网络,包括编码器,解码器和后处理网络。train.py用于培训。synthesis.py用于生成TTS样品。 hyperparams.py中调整超参数,尤其是“ data_path”,这是您提取文件的目录,以及如有必要的目录。train.py 。 synthesis.py 。确保还原步骤。