Transformer TTS
1.0.0

pip install -r requirements.txt





คุณสามารถตรวจสอบตัวอย่างที่สร้างขึ้นด้านล่าง ตัวอย่างทั้งหมดอยู่ที่ 160K ดังนั้นฉันคิดว่าโมเดลยังไม่ได้มาบรรจบกัน รุ่นนี้ดูเหมือนจะมีประสิทธิภาพต่ำกว่าในประโยคยาว
พล็อตแรกคือ mel spectrogram ที่คาดการณ์ไว้และที่สองคือความจริงพื้นฐาน


hyperparams.py รวมพารามิเตอร์ไฮเปอร์ทั้งหมดที่จำเป็นprepare_data.py Preprocess WAV ไฟล์ไปยัง MEL, Spectrogram เชิงเส้นและบันทึกไว้สำหรับเวลาการฝึกอบรมที่เร็วขึ้น รหัสการประมวลผลล่วงหน้าสำหรับข้อความอยู่ในข้อความ/ ไดเรกทอรีpreprocess.py รวมรหัสการประมวลผลล่วงหน้าทั้งหมดเมื่อคุณโหลดข้อมูลmodule.py มีวิธีการทั้งหมดรวมถึงความสนใจ prenet, postnet และอื่น ๆnetwork.py มีเครือข่ายรวมถึง Encoder, Decoder และเครือข่ายหลังการประมวลผลtrain_transformer.py สำหรับการฝึกอบรมเครือข่ายความสนใจอัตโนมัติ (ข้อความ -> เมล)train_postnet.py ใช้สำหรับการฝึกอบรมเครือข่าย (mel -> linear)synthesis.py ใช้สำหรับการสร้างตัวอย่าง TTS hyperparams.py โดยเฉพาะ 'data_path' ซึ่งเป็นไดเรกทอรีที่คุณแยกไฟล์และอื่น ๆ หากจำเป็นprepare_data.pytrain_transformer.pytrain_postnet.py synthesis.py ตรวจสอบให้แน่ใจว่าขั้นตอนการกู้คืน