FlashSpeech
1.0.0
Implementasi FlashSpeech. Untuk semua detail, lihat makalah kami yang diterima untuk ACM MM 2024: FlashSpeech: Sintesis ucapan zero-shot yang efisien.
bash env.shaccelerate dengan lightning karena saya mengalami masalah serupa (masalah terkait). Pelatihan dengan lightning lebih cepat. ns2dataset.py berdasarkan data Anda.bash egs/tts/NaturalSpeech2/run_train.shCatatan Penting :
Pilih Konfigurasi :
***_s1 atau ***_s2 berdasarkan tahap pelatihan.Modifikasi Codec Model :
models/tts/naturalspeech2/flashspeech.py , perbarui codec untuk Anda sendiri.self.latent_norm untuk menormalkan codec laten dengan standar deviasi. (Langkah ini sangat penting untuk melatih model konsistensi.)Pengaturan Tahap 2 :
models/tts/naturalspeech2/flashspeech_trainer_stage2.py , atur bobot awal yang diperoleh dari pelatihan tahap 1.Pengembangan Tahap 3 :
Lebih lanjut mengatur struktur proyek dan selesaikan kode yang tersisa.
Terima kasih khusus kepada Amphion , karena basis kode kami terutama dipinjam dari Amphion.
Terima kasih telah menggunakan FlashSpeech!