adversarial tts
1.0.0
พื้นที่เก็บข้อมูลนี้มีสคริปต์การใช้งานและการฝึกอบรมแบบ end-to-end สำหรับโมเดลข้อความเป็นคำพูดโดยใช้ข้อความจากการพูดแบบ end-to-to-to-to-to-to-to-to-to-to-to-to-to-to-to-et al. 2020)
ในการตั้งค่าสภาพแวดล้อม Python ให้เรียกใช้
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtไฟล์เสียงรวมจากชุดข้อมูล LJ-speech โดยรัน
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt ระบุเส้นทางไปยัง metadata.csv ผ่านธง --metadata_file ดาวน์โหลดพจนานุกรม CMU Phonemizer ที่นี่และระบุเส้นทางผ่านธง --cmudict_file
เพื่อฝึกซ้อมเพียงแค่วิ่ง
python train.py -c config.yml