FlashSpeech
1.0.0
FlashSpeech의 구현. 모든 세부 사항은 ACM MM 2024 : FlashSpeech : 효율적인 제로 샷 음성 합성에 수락 된 논문을 확인하십시오.
bash env.shaccelerate lightning 로 교체했습니다. lightning 로 훈련하는 것이 더 빠릅니다. ns2dataset.py 수정하십시오.bash egs/tts/NaturalSpeech2/run_train.sh중요한 메모 :
구성 선택 :
***_s1 또는 ***_s2 구성 파일을 선택할 수 있습니다.모델 코덱 수정 :
models/tts/naturalspeech2/flashspeech.py 에서 코덱을 자신의 것으로 업데이트하십시오.self.latent_norm 조정하십시오. (이 단계는 일관성 모델을 훈련시키는 데 중요합니다.)2 단계 설정 :
models/tts/naturalspeech2/flashspeech_trainer_stage2.py 에서 1 단계 훈련에서 얻은 초기 가중치를 설정하십시오.3 단계 개발 :
프로젝트 구조를 추가로 구성하고 나머지 코드를 완성하십시오.
코드베이스는 주로 Amphion에서 빌려 주므로 Amphion 에게 특별한 감사를드립니다.
FlashSpeech를 사용해 주셔서 감사합니다!