adversarial tts
1.0.0
該存儲庫包含基於端到端對抗文本到語音的文本到語音模型的實現和端到端的培訓腳本(Donahue等,2020)。
為了設置Python環境,運行
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txt通過運行從LJ-Speech數據集中匯總音頻文件
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt通過--metadata_file標誌指定metadata.csv的路徑。在此處下載CMU Phonemizer字典,並通過--cmudict_file標誌指定路徑。
要訓練,只需運行
python train.py -c config.yml