adversarial tts
1.0.0
Repositori ini berisi implementasi dan skrip pelatihan end-to-end untuk model teks-ke-pidato, berdasarkan teks-ke-end-ke-ujung teks-ke-speech (Donahue et al. 2020).
Untuk mengatur lingkungan Python, jalankan
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txtAgregat file audio dari dataset lj-speech dengan berjalan
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt Tentukan jalur ke metadata.csv melalui bendera --metadata_file . Unduh Kamus Fonemizer CMU di sini dan tentukan jalur melalui bendera --cmudict_file .
Untuk berlatih, cukup lari
python train.py -c config.yml