FlashSpeech
1.0.0
تنفيذ flashspeech. للحصول على جميع التفاصيل ، تحقق من ورقةنا المقبولة إلى ACM MM 2024: Flashspeech: تخليق الكلام الصفر الفعال.
bash env.shaccelerate Amphion مع lightning لأنني واجهت مشكلات مماثلة (قضية ذات صلة). التدريب مع lightning أسرع. ns2dataset.py بناءً على بياناتك.bash egs/tts/NaturalSpeech2/run_train.shملاحظات مهمة :
اختر التكوين :
***_s1 أو ***_s2 بناءً على مرحلة التدريب.تعديل برنامج ترميز النموذج :
models/tts/naturalspeech2/flashspeech.py ، قم بتحديث برنامج الترميز الخاص بك.self.latent_norm لتطبيع برنامج الترميز الكامن إلى الانحراف المعياري. (هذه الخطوة أمر بالغ الأهمية لتدريب نموذج الاتساق.)إعداد المرحلة 2 :
models/tts/naturalspeech2/flashspeech_trainer_stage2.py ، قم بتعيين الأوزان الأولية التي تم الحصول عليها من تدريب المرحلة الأولى.تطور المرحلة 3 :
مزيد من تنظيم هيكل المشروع واستكمل الكود المتبقي.
شكر خاص للبرمفيون ، حيث يتم استعارة قاعدة كودنا في المقام الأول من Amphion.
شكرا لك على استخدام FlashSpeech!