FlashSpeech
1.0.0
Flashspeech的實現。有關所有詳細信息,請查看我們接受ACM MM 2024接受的論文:FlashSpeech:有效的零彈性語音合成。
bash env.shlightning替換了Amphion的accelerate 。 lightning訓練更快。 ns2dataset.py 。bash egs/tts/NaturalSpeech2/run_train.sh重要說明:
選擇配置:
***_s1或***_s2配置文件。修改模型編解碼器:
models/tts/naturalspeech2/flashspeech.py中,將編解碼器更新為自己。self.latent_norm ,以使對標準偏差的編解碼器標準化。 (此步驟對於訓練一致性模型至關重要。)階段2設置:
models/tts/naturalspeech2/flashspeech_trainer_stage2.py中,設置了從階段1訓練獲得的初始權重。第三階段發展:
進一步組織項目結構並完成其餘代碼。
特別感謝Amphion ,因為我們的代碼庫主要是從Amphion借來的。
感謝您使用FlashSpeech!