MSMC TTS
1.0.0
MSMC-TTS論文系統的官方實施
最新的MSMC-TTS(MSMC-TTS-V2)使用基於MSMC-VQ-GAN的自動編碼器組合MSMC-VQ-VAE和Hifigan進行了優化。多階段預測變量仍被用作聲學模型,以預測TTS合成的MSMCR。 
[2024.04.10](正在進行中)QS-TTS的實現可在示例/csmsc/configs中獲得
[2022.10.20]我們發布了基於MSMC-VQ-GAN的最新版本的MSMC-TTS(MSMC-TTS-V2)。請參閱我們的最新論文“通過學習緊湊的表示形式,使用低資源語言的高質量神經TTS”
[2022.10.18]我們將在此存儲庫中發布所有版本的MSMC-TTS的代碼。歡迎對這項工作感興趣的任何人加入我們,探索更有用的語音綜合語音表示。
[2022.9.22]“高性能神經TTS的多階段多代碼Book VQ-VAE方法”在Interspeech 2022上發布。
# Install
pip -r requirements.txt
# Train (Take the example of CSMSC, please refer to the example of CSMSC to prepare your training data)
python train.py -c examples/csmsc/configs/msmc_vq_gan.yaml
python train.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml
# Multi-GPU Training
python train_dist.py -c examples/csmsc/configs/msmc_vq_gan.yaml
python train_dist.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml
# Test -- Analysis-Synthesis
python infer.py -c examples/csmsc/configs/msmc_vq_gan.yaml -m examples/csmsc/checkpoints/msmc_vq_gan/model_800000 -t examples/csmsc/data/test_ae.yaml -o analysis_synthesis
# Test -- TTS-Synthesis
python infer.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml -m examples/csmsc/checkpoints/msmc_vq_gan_am/model_200000 -t examples/csmsc/data/test_tts.yaml -o tts
幫助您更好地訓練模型!
@inproceedings{guo2022msmc,
title={A Multi-Stage Multi-Codebook VQ-VAE Approach to High-Performance Neural TTS},
author={Guo, Haohan and Xie, Fenglong and Soong, Frank K and Wu, Xixin and Meng, Helen},
booktitle={Proc. INTERSPEECH},
year={2022}
}