FlashSpeech
1.0.0
Flashspeech的实现。有关所有详细信息,请查看我们接受ACM MM 2024接受的论文:FlashSpeech:有效的零弹性语音合成。
bash env.shlightning替换了Amphion的accelerate 。 lightning训练更快。 ns2dataset.py 。bash egs/tts/NaturalSpeech2/run_train.sh重要说明:
选择配置:
***_s1或***_s2配置文件。修改模型编解码器:
models/tts/naturalspeech2/flashspeech.py中,将编解码器更新为自己。self.latent_norm ,以使对标准偏差的编解码器标准化。 (此步骤对于训练一致性模型至关重要。)阶段2设置:
models/tts/naturalspeech2/flashspeech_trainer_stage2.py中,设置了从阶段1训练获得的初始权重。第三阶段发展:
进一步组织项目结构并完成其余代码。
特别感谢Amphion ,因为我们的代码库主要是从Amphion借来的。
感谢您使用FlashSpeech!