DiffWave Vocoder
1.0.0
هذا هو إعادة تنفيذ المتفرج العصبي في Diffwave: نموذج انتشار متعدد الاستخدامات لتوليف الصوت.
لمتابعة تدريب النموذج ، قم بتشغيل python distributed_train.py -c config_${channel}.json ، حيث يمكن أن يكون ${channel} 64 أو 128 .
لإعادة تدريب النموذج ، قم بتغيير المعلمة ckpt_iter في ملف json المقابل إلى -1 واستخدم الأمر أعلاه.
لإنشاء الصوت ، قم بتشغيل python inference.py -c config_${channel}.json -cond ${conditioner_name} . على سبيل المثال ، إذا كان اسم طيف MEL هو LJ001-0001.wav.pt ، فإن ${conditioner_name} هو LJ001-0001 . شريطة أن تتضمن طيف MEL LJ001-0001 من خلال LJ001-0186 .
ملاحظة ، قد تحتاج إلى ضبط بعض المعلمات بعناية في ملف json ، مثل data_path و batch_size_per_gpu .