adversarial tts
1.0.0
Ce référentiel contient des scripts de mise en œuvre et de formation de bout en bout pour les modèles de texte vocale, basé sur le tex-voca-vocation adversaire de bout en bout (Donahue et al. 2020).
Pour configurer l'environnement Python, exécutez
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtLes fichiers audio agrégées de l'ensemble de données LJ-Speech en exécutant
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt Spécifiez le chemin vers le metadata.csv via le drapeau --metadata_file . Téléchargez le dictionnaire CMU Phonimizer ici et spécifiez le chemin via le drapeau --cmudict_file .
Pour s'entraîner, courez simplement
python train.py -c config.yml