A (เงื่อนไข) การสังเคราะห์เสียงเครือข่ายการกำเนิดที่เกิดจากการสร้างสเปคโตรรากซึ่งสังเคราะห์รูปคลื่นดิบต่อไปการใช้งานใน TensorFlow 
การสังเคราะห์แบบข้อความเป็นคำพูดโดยการสร้างสเปกโตรแกรมโดยใช้เครือข่ายศัตรูกำเนิด งานนี้ขึ้นอยู่กับการใช้งานดั้งเดิมของ Specgan ซึ่งฉันสำรวจการฝึกอบรมการปรับสภาพ Specgan นอกจากนี้ยังมีการใช้รูปแบบการประมวลผลข้อมูลล่วงหน้าด้วยพลังงานซึ่งส่งผลให้มีการปรับปรุงคุณภาพเสียง
ผลการประมวลผลล่วงหน้าสามารถแสดงให้เห็นได้โดยการสร้างภาพต่อไปนี้: 
ดาวน์โหลดข้อมูลการฝึกอบรม: ที่นี่
run './src/utils/preprocess_data.py' เพื่อประมวลผลข้อมูลหรือดาวน์โหลดข้อมูลที่ประมวลผล: ที่นี่
run './src/utils/visualize_wav.py' เพื่อให้เห็นภาพข้อมูลที่สะอาดที่ประมวลผลหรือดาวน์โหลดผลลัพธ์: ที่นี่
run './src/utils/make_tfrecord.py' เพื่อประมวลผลไฟล์. wav ลงในไฟล์. TFRECORD พร้อมไฟล์พร้อมหรือดาวน์โหลดข้อมูลที่ประมวลผล: ที่นี่
แยกไฟล์. tgz ในขั้นตอนที่ 4 และวางไว้ในเส้นทางที่เกี่ยวข้องตาม args.data_dir ใน ./src/config.py:
data_dir='../data/sc09_preprocess_energy'
พา ธ เริ่มต้นนี้สามารถแก้ไขได้โดยการเปลี่ยนตัวเลือก '-data_dir ใน' ./src/config.py '
python3 ./src/runner.py train
python3 ./src/runner.py generate
python3 ./src/runner.py train --conditional
python3 ./src/runner.py generate --conditional