adversarial tts
1.0.0
이 저장소에는 엔드 투 엔드 적대적 텍스트 음성 연사를 기반으로 텍스트 음성 연설 모델에 대한 구현 및 엔드 투 엔드 교육 스크립트가 포함되어 있습니다 (Donahue et al. 2020).
파이썬 환경을 설정하려면 실행하십시오
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txt실행하여 LJ-Speech 데이터 세트의 오디오 파일을 집계하십시오
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt --metadata_file 플래그를 통해 metadata.csv 로의 경로를 지정하십시오. CMU Phonemizer Dictionary를 여기에서 다운로드하고 --cmudict_file 플래그를 통해 경로를 지정하십시오.
훈련하려면 단순히 달리십시오
python train.py -c config.yml