MSMC TTS
1.0.0
MSMC-TTS 용지 시스템의 공식 구현
최신 MSMC-TTS (MSMC-TTS-V2)는 MSMC-VQ-VAE 및 Hifigan을 결합한 MSMC-VQ-GAN 기반 오토 엔코더로 최적화됩니다. 다단계 예측 변수는 여전히 TTS 합성에 대한 MSMCR을 예측하기위한 음향 모델로 적용됩니다. 
[2024.04.10] (진행중인) QS-TTS의 구현은 예/csmsc/configs에서 사용할 수 있습니다.
[2022.10.20] MSMC-VQ-GAN을 기반으로 최신 버전의 MSMC-TTS (MSMC-TTS-V2)를 출시합니다. 최신 논문을 참조하십시오. "소형 표현을 학습하여 저주적 언어에 대한 고품질 신경 TTS에 대한 최신 논문"을 참조하십시오.
[2022.10.18] 우리는이 repo에서 모든 버전의 MSMC-TTS의 코드를 발표 할 것입니다. 그리고이 작품에 관심이있는 사람은 우리와 함께 음성 합성을위한보다 유용한 언어 표현을 탐구 할 수 있습니다.
[2022.9.22] "고성능 신경 TTS에 대한 다단계 멀티 코드 북 VQ-VAE 접근법이 Interspeech 2022에 발표된다.
# Install
pip -r requirements.txt
# Train (Take the example of CSMSC, please refer to the example of CSMSC to prepare your training data)
python train.py -c examples/csmsc/configs/msmc_vq_gan.yaml
python train.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml
# Multi-GPU Training
python train_dist.py -c examples/csmsc/configs/msmc_vq_gan.yaml
python train_dist.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml
# Test -- Analysis-Synthesis
python infer.py -c examples/csmsc/configs/msmc_vq_gan.yaml -m examples/csmsc/checkpoints/msmc_vq_gan/model_800000 -t examples/csmsc/data/test_ae.yaml -o analysis_synthesis
# Test -- TTS-Synthesis
python infer.py -c examples/csmsc/configs/msmc_vq_gan_am.yaml -m examples/csmsc/checkpoints/msmc_vq_gan_am/model_200000 -t examples/csmsc/data/test_tts.yaml -o tts
모델을 더 잘 훈련시키는 데 도움이됩니다!
@inproceedings{guo2022msmc,
title={A Multi-Stage Multi-Codebook VQ-VAE Approach to High-Performance Neural TTS},
author={Guo, Haohan and Xie, Fenglong and Soong, Frank K and Wu, Xixin and Meng, Helen},
booktitle={Proc. INTERSPEECH},
year={2022}
}