deepaudio tts
1.0.0
Deepaudio-TTS เป็นกรอบการทำงานสำหรับการฝึกอบรมโมเดลข้อความจากเครือข่ายการพูดด้วยระบบประสาท (TTS) มัน inlcudes หรือจะรวมถึงสถาปัตยกรรมเครือข่ายประสาทยอดนิยมสำหรับ TTS และโมเดล Vocoder
เพื่อให้ง่ายต่อการใช้งานฟังก์ชั่นต่าง ๆ เช่นความแม่นยำแบบผสมการฝึกอบรมแบบหลายโหนดและการฝึกอบรม TPU ฯลฯ ฉันได้แนะนำ Pytorch-Lighting และ Hydra ในกรอบนี้ มันยังอยู่ในระหว่างการพัฒนา
$ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata
มันเป็นโครงการส่วนบุคคล ดังนั้นฉันจึงไม่มีทรัพยากร GPU เพียงพอที่จะทำการทดลองจำนวนมาก โครงการนี้ยังอยู่ในระหว่างการพัฒนา ฉันขอขอบคุณข้อเสนอแนะหรือการมีส่วนร่วมใด ๆ โปรดอย่าลังเลที่จะทำการดึง requsest สำหรับปัญหาเล็ก ๆ น้อย ๆ เช่นการแก้ไขข้อผิดพลาดผลการทดลอง หากคุณมีคำถามใด ๆ โปรดเปิดปัญหา
ฉันยืมรหัสจำนวนมากจาก Espnet และ Paddle Speech