Tacotron pytorch
1.0.0
การใช้งาน Pytorch ของ Tacotron: แบบจำลองการสังเคราะห์แบบข้อความถึงแบบพูดแบบ end-to-end อย่างเต็มที่

pip install -r requirements.txt
ฉันใช้ชุดข้อมูล LJSpeech ซึ่งประกอบด้วยคู่ของสคริปต์ข้อความและไฟล์ WAV สามารถดาวน์โหลดชุดข้อมูลที่สมบูรณ์ (13,100 คู่) ได้ที่นี่ ฉันอ้างถึง https://github.com/keithito/tacotron สำหรับรหัสการประมวลผลล่วงหน้า
hyperparams.py รวมพารามิเตอร์ไฮเปอร์ทั้งหมดที่จำเป็นdata.py โหลดข้อมูลการฝึกอบรมและข้อความประมวลผลล่วงหน้าเพื่อดัชนีและไฟล์ WAV ไปยัง Spectrogram รหัสการประมวลผลล่วงหน้าสำหรับข้อความอยู่ในข้อความ/ ไดเรกทอรีmodule.py มีวิธีการทั้งหมดรวมถึง CBHG, Highway, Prenet และอื่น ๆnetwork.py มีเครือข่ายรวมถึง Encoder, Decoder และเครือข่ายหลังการประมวลผลtrain.py สำหรับการฝึกอบรมsynthesis.py ใช้สำหรับการสร้างตัวอย่าง TTS hyperparams.py โดยเฉพาะ 'data_path' ซึ่งเป็นไดเรกทอรีที่คุณแยกไฟล์และอื่น ๆ หากจำเป็นtrain.py synthesis.py ตรวจสอบให้แน่ใจว่าขั้นตอนการกู้คืน