adversarial tts
1.0.0
Este repositorio contiene scripts de implementación y capacitación de extremo a extremo para modelos de texto a voz, basados en texto a discurso adversario de extremo a extremo (Donahue et al. 2020).
Para configurar el entorno Python, ejecute
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtArchivos de audio agregados desde el conjunto de datos LJ-speech ejecutando
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt Especifique la ruta a metadata.csv a través del indicador --metadata_file . Descargue el diccionario CMU Phonemizer aquí y especifique la ruta a través del indicador --cmudict_file .
Para entrenar, simplemente corre
python train.py -c config.yml