adversarial tts
1.0.0
يحتوي هذا المستودع على التنفيذ والبرامج النصية التدريبية من طرف إلى طرف لنماذج النص إلى الكلام ، استنادًا إلى النص العددي من نص إلى خط الكبير (Donahue et al. 2020).
لإعداد بيئة بيثون ، قم بتشغيل
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtمجمّع ملفات الصوت من مجموعة بيانات LJ-Specte عن طريق التشغيل
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt حدد المسار إلى metadata.csv عبر العلم --metadata_file . قم بتنزيل قاموس CMU phonemizer هنا وحدد المسار عبر علامة --cmudict_file .
للتدريب ، ببساطة الجري
python train.py -c config.yml