ดาวน์โหลด deepaudio tts - deepaudio tts Source Source Download

deepaudio tts

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Deepaudio-TTS คืออะไร?

Deepaudio-TTS เป็นกรอบการทำงานสำหรับการฝึกอบรมโมเดลข้อความจากเครือข่ายการพูดด้วยระบบประสาท (TTS) มัน inlcudes หรือจะรวมถึงสถาปัตยกรรมเครือข่ายประสาทยอดนิยมสำหรับ TTS และโมเดล Vocoder

เพื่อให้ง่ายต่อการใช้งานฟังก์ชั่นต่าง ๆ เช่นความแม่นยำแบบผสมการฝึกอบรมแบบหลายโหนดและการฝึกอบรม TPU ฯลฯ ฉันได้แนะนำ Pytorch-Lighting และ Hydra ในกรอบนี้ มันยังอยู่ในระหว่างการพัฒนา

ตัวอย่างการฝึกอบรม

ประมวลผลข้อมูลล่วงหน้าของคุณ (สคริปต์ที่จะมาเร็ว ๆ นี้หรือคุณสามารถทำตามการสอนการพูดพายสำหรับขั้นตอนนี้)
ฝึกอบรมแบบจำลอง คุณสามารถเลือกการทดลองหนึ่งครั้งใน Deepaudio/TTS/CLI/Configs/Experiment จากนั้นฝึกอบรมแบบจำลองด้วยบรรทัดต่อไปนี้:

 $ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata

รุ่นที่รองรับ

Tacotron2
FastSpeech2
Transformer TTS
Wavegan คู่ขนาน
ไฮเฟก้า
เข้าด้วยกัน

แผนอนาคต

รหัสทำความสะอาด

ลบรหัสซ้ำซ้อน
ทำให้ Deepaudio.tts.models สะอาดขึ้น

แบบจำลอง

รุ่นอื่น ๆ
แบบจำลองก่อนหน้า

การปรับใช้

onnx
การเจียระไน

วิธีการมีส่วนร่วมใน deepaudio-tts

มันเป็นโครงการส่วนบุคคล ดังนั้นฉันจึงไม่มีทรัพยากร GPU เพียงพอที่จะทำการทดลองจำนวนมาก โครงการนี้ยังอยู่ในระหว่างการพัฒนา ฉันขอขอบคุณข้อเสนอแนะหรือการมีส่วนร่วมใด ๆ โปรดอย่าลังเลที่จะทำการดึง requsest สำหรับปัญหาเล็ก ๆ น้อย ๆ เช่นการแก้ไขข้อผิดพลาดผลการทดลอง หากคุณมีคำถามใด ๆ โปรดเปิดปัญหา