adversarial tts
1.0.0
Этот репозиторий содержит внедрение и сквозные тренировочные сценарии для моделей текста в речь, основанные на сквозной одноразовой состязательной тексте в речь (Donahue et al. 2020).
Чтобы настроить среду Python, запустите
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtСовокупные аудиофайлы из набора данных LJ-Speech, запустив
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt Укажите путь к metadata.csv через флаг --metadata_file . Загрузите здесь словарь Phonemizer CMU и укажите путь через флаг --cmudict_file .
Тренироваться, просто беги
python train.py -c config.yml