adversarial tts
1.0.0
Dieses Repository enthält Implementierungs- und End-to-End-Trainingsskripte für Text-zu-Sprache-Modelle, die auf End-to-End-kontroversen Text-zu-Sprache basieren (Donahue et al. 2020).
Um die Python -Umgebung einzurichten, laufen Sie
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtAggregate Audiodateien aus dem LJ-Speech-Datensatz durch Ausführen
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt Geben Sie den Pfad zum metadata.csv über das Flag --metadata_file an. Laden Sie das CMU Phonemizer Dictionary hier herunter und geben Sie den Pfad über das Flag --cmudict_file an.
Einfach trainieren, einfach rennen
python train.py -c config.yml