FlashSpeech
1.0.0
Implementierung des Flashspeech. Für alle Details finden Sie unser auf ACM MM 2024 akzeptiertes Papier: Flasspeech: Effiziente Null-Shot-Sprachsynthese.
bash env.shaccelerate durch lightning ersetzt, weil ich ähnliche Probleme (verwandtes Problem) gestoßen habe. Das Training mit lightning ist schneller. ns2dataset.py basierend auf Ihren Daten.bash egs/tts/NaturalSpeech2/run_train.shWichtige Anmerkungen :
Wählen Sie Konfiguration :
***_s1 oder ***_s2 -Konfigurationsdateien basierend auf der Trainingsphase auswählen.Modellcodec ändern :
models/tts/naturalspeech2/flashspeech.py den Codec auf Ihren eigenen.self.latent_norm an, um den Codec latent auf die Standardabweichung zu normalisieren. (Dieser Schritt ist entscheidend für das Training des Konsistenzmodells.)Stufe 2 Setup :
models/tts/naturalspeech2/flashspeech_trainer_stage2.py die anfänglichen Gewichte aus dem Training Stufe 1.Entwicklung der Stufe 3 :
Organisieren Sie die Projektstruktur weiter und vervollständigen Sie den verbleibenden Code.
Besonderer Dank geht an Amphion , da unsere Codebasis hauptsächlich von Amphion entlehnt wird.
Vielen Dank, dass Sie Flasspeech verwendet haben!