adversarial tts
1.0.0
Esse repositório contém scripts de treinamento de implementação e de ponta a ponta para modelos de texto em fala, baseados em texto adversário de ponta a ponta (Donahue et al. 2020).
Para configurar o ambiente Python, execute
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtArquivos de áudio agregados do conjunto de dados de LJ-Esteech, executando
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt Especifique o caminho para os metadata.csv através do sinalizador --metadata_file . Faça o download do dicionário CMU Phonemizer aqui e especifique o caminho através do sinalizador --cmudict_file .
Para treinar, basta correr
python train.py -c config.yml