DiffWave Vocoder
1.0.0
นี่คือ reimplementaion ของนักร้องประสาทใน Diffwave: รูปแบบการแพร่กระจายที่หลากหลายสำหรับการสังเคราะห์เสียง
ในการฝึกอบรมแบบจำลองต่อให้เรียกใช้ python distributed_train.py -c config_${channel}.json , โดยที่ ${channel} สามารถเป็นได้ทั้ง 64 หรือ 128
ในการฝึกอบรมแบบจำลองใหม่ให้เปลี่ยนพารามิเตอร์ ckpt_iter ในไฟล์ json ที่สอดคล้องกันเป็น -1 และใช้คำสั่งด้านบน
ในการสร้างเสียงให้เรียกใช้ python inference.py -c config_${channel}.json -cond ${conditioner_name} ตัวอย่างเช่นหากชื่อของ mel spectrogram คือ LJ001-0001.wav.pt ดังนั้น ${conditioner_name} คือ LJ001-0001 MEL spectrograms รวมถึง LJ001-0001 ถึง LJ001-0186
หมายเหตุคุณอาจต้องปรับพารามิเตอร์บางอย่างในไฟล์ json อย่างรอบคอบเช่น data_path และ batch_size_per_gpu