adversarial tts
1.0.0
该存储库包含基于端到端对抗文本到语音的文本到语音模型的实现和端到端的培训脚本(Donahue等,2020)。
为了设置Python环境,运行
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txt通过运行从LJ-Speech数据集中汇总音频文件
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt通过--metadata_file标志指定metadata.csv的路径。在此处下载CMU Phonemizer字典,并通过--cmudict_file标志指定路径。
要训练,只需运行
python train.py -c config.yml