melgan multi
1.0.0
การใช้ Pytorch ของ Melgan: เครือข่ายที่เป็นปฏิปักษ์ต่อการสังเคราะห์รูปคลื่นแบบมีเงื่อนไข
การใช้งานนี้รวมถึงการสนับสนุน แบบกระจาย และใช้ชุดข้อมูล LJSpeech
data/LJSpeech-1.1/wavs python train.py --config=config.json --cps=cp_melgan ไดเรกทอรีจุดตรวจสอบเริ่มต้นคือ cp_melgan
บันทึก Tensorboard จะถูกบันทึกใน cp_melgan/logs
python distributed.py --config=config.json --args_str="--cps=cp_melgan"รหัสการฝึกอบรมตรวจจับ GPU ทั้งหมดและตั้งค่าโดยอัตโนมัติ
ตัวอย่างปัจจุบัน (ขั้นตอน 489K)
ตัวอย่าง
สามารถได้ยินเสียงตัวอย่างบนกระดานเทนซอร์บอร์ดด้วย 
Spectrograme ที่สร้างขึ้นสามารถเห็นได้บน Tensorboard 
เร็วๆ นี้..
ฉันจะส่งรหัสอนุมานเต็มรูปแบบเร็ว ๆ นี้
ฉันอ้างถึง Waveglow เพื่อใช้การประมวลผลเสียงล่วงหน้า