(شرطية) توليف الصوت الشبكة العدائية التوليفية التي تولد طيف ، والتي تجمع توليف الموجة الخام ، التنفيذ في التوتر. 
توليف النص إلى الكلام عن طريق توليد طيف باستخدام شبكة عدوانية توليدية. يعتمد هذا العمل على التنفيذ الأصلي لـ SPECGAN ، حيث استكشفت عن تدريب تكييف Specgan. بالإضافة إلى ذلك ، يتم تطبيق مخطط معالجة البيانات القائم على الطاقة ، مما يؤدي إلى تحسن في جودة الصوت.
يمكن إثبات نتيجة المعالجة المسبقة من خلال التصور التالي: 
تنزيل بيانات التدريب: هنا
قم بتشغيل './src/utils/preprocess_data.py' لمعالجة البيانات أو تنزيل البيانات المعالجة: هنا
قم بتشغيل './src/utils/visualize_wav.py' لتصور البيانات النظيفة المعالجة أو تنزيل النتائج: هنا
قم بتشغيل './src/utils/make_tfrecord.py' لمعالجة ملفات .wav في ملفات تدريب .Tfrecord ، أو تنزيل البيانات المعالجة: هنا
استخراج ملف .tgz في الخطوة.
data_dir='../data/sc09_preprocess_energy'
يمكن تعديل هذا المسار الافتراضي عن طريق تغيير خيار "-data_dir في" ./src/config.py ".
python3 ./src/runner.py train
python3 ./src/runner.py generate
python3 ./src/runner.py train --conditional
python3 ./src/runner.py generate --conditional