adversarial tts 다운로드 - adversarial tts 소스 코드 다운로드

한국어

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

다운로드

생성 적대적 네트워크를 갖춘 엔드 투 엔드 텍스트-음성

이 저장소에는 엔드 투 엔드 적대적 텍스트 음성 연사를 기반으로 텍스트 음성 연설 모델에 대한 구현 및 엔드 투 엔드 교육 스크립트가 포함되어 있습니다 (Donahue et al. 2020).

파이썬 환경을 설정하려면 실행하십시오

python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txt

실행하여 LJ-Speech 데이터 세트의 오디오 파일을 집계하십시오

ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt

--metadata_file 플래그를 통해 metadata.csv 로의 경로를 지정하십시오. CMU Phonemizer Dictionary를 여기에서 다운로드하고 --cmudict_file 플래그를 통해 경로를 지정하십시오.

훈련하려면 단순히 달리십시오

python train.py -c config.yml

확장하다

추가 정보