MSMC TTS
1.0.0
MSMC-TTS论文系统的官方实施
最新的MSMC-TTS(MSMC-TTS-V2)使用基于MSMC-VQ-GAN的自动编码器组合MSMC-VQ-VAE和Hifigan进行了优化。多阶段预测变量仍被用作声学模型,以预测TTS合成的MSMCR。 
[2024.04.10](正在进行中)QS-TTS的实现可在示例/csmsc/configs中获得
[2022.10.20]我们发布了基于MSMC-VQ-GAN的最新版本的MSMC-TTS(MSMC-TTS-V2)。请参阅我们的最新论文“通过学习紧凑的表示形式,使用低资源语言的高质量神经TTS”
[2022.10.18]我们将在此存储库中发布所有版本的MSMC-TTS的代码。欢迎对这项工作感兴趣的任何人加入我们,探索更有用的语音综合语音表示。
[2022.9.22]“高性能神经TTS的多阶段多代码Book VQ-VAE方法”在Interspeech 2022上发布。
# Install
pip -r requirements.txt
# Train (Take the example of CSMSC, please refer to the example of CSMSC to prepare your training data)
python train.py -c examples/csmsc/configs/msmc_vq_gan.yaml
python train.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml
# Multi-GPU Training
python train_dist.py -c examples/csmsc/configs/msmc_vq_gan.yaml
python train_dist.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml
# Test -- Analysis-Synthesis
python infer.py -c examples/csmsc/configs/msmc_vq_gan.yaml -m examples/csmsc/checkpoints/msmc_vq_gan/model_800000 -t examples/csmsc/data/test_ae.yaml -o analysis_synthesis
# Test -- TTS-Synthesis
python infer.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml -m examples/csmsc/checkpoints/msmc_vq_gan_am/model_200000 -t examples/csmsc/data/test_tts.yaml -o tts
帮助您更好地训练模型!
@inproceedings{guo2022msmc,
title={A Multi-Stage Multi-Codebook VQ-VAE Approach to High-Performance Neural TTS},
author={Guo, Haohan and Xie, Fenglong and Soong, Frank K and Wu, Xixin and Meng, Helen},
booktitle={Proc. INTERSPEECH},
year={2022}
}