FlashSpeech
1.0.0
การใช้งาน FlashSpeech สำหรับรายละเอียดทั้งหมดตรวจสอบบทความของเราที่ได้รับการยอมรับจาก ACM MM 2024: FlashSpeech: การสังเคราะห์คำพูดที่มีประสิทธิภาพเป็นศูนย์-ช็อต
bash env.shaccelerate ของ Amphion ด้วย lightning เพราะฉันพบปัญหาที่คล้ายกัน (ปัญหาที่เกี่ยวข้อง) การฝึกด้วย lightning เร็วขึ้น ns2dataset.py ตามข้อมูลของคุณbash egs/tts/NaturalSpeech2/run_train.shหมายเหตุสำคัญ :
เลือกการกำหนดค่า :
***_s1 หรือ ***_s2 ตามขั้นตอนการฝึกอบรมแก้ไขตัวแปลงสัญญาณรุ่น :
models/tts/naturalspeech2/flashspeech.py อัปเดตตัวแปลงสัญญาณเป็นของคุณเองself.latent_norm เพื่อทำให้ตัวแปลงสัญญาณแฝงเป็นปกติกับค่าเบี่ยงเบนมาตรฐาน (ขั้นตอนนี้มีความสำคัญสำหรับการฝึกอบรมแบบจำลองความสอดคล้อง)ขั้นตอนที่ 2 การตั้งค่า :
models/tts/naturalspeech2/flashspeech_trainer_stage2.py ตั้งค่าน้ำหนักเริ่มต้นที่ได้จากการฝึกขั้นตอนที่ 1ขั้นตอนที่ 3 การพัฒนา :
จัดระเบียบโครงสร้างโครงการเพิ่มเติมและกรอกรหัสที่เหลือ
ขอขอบคุณเป็นพิเศษกับ Amphion เนื่องจาก Codebase ของเรายืมมาจาก Amphion เป็นหลัก
ขอบคุณที่ใช้ FlashSpeech!