adversarial tts
1.0.0
このリポジトリには、エンドツーエンドの敵対的なテキストからスピーチに基づいたテキストからスピーチモデルの実装およびエンドツーエンドトレーニングスクリプトが含まれています(Donahue etal。2020)。
Python環境をセットアップするには、実行します
python -m venv ttsgan
source ttsgan/bin/activate
python -m pip install --upgrade pip
python -m pip install -r requirements.txt実行して、LJスピーチデータセットからオーディオファイルを集約します
ls LJSpeech-1.1/wavs/ * .wav | tail -n+10 > train_files.txt
ls LJSpeech-1.1/wavs/ * .wav | head -n10 > test_files.txt --metadata_fileフラグを介してmetadata.csvへのパスを指定します。 CMUフォーンマイザー辞書をこちらからダウンロードし、 --cmudict_fileフラグを介してパスを指定します。
トレーニングするには、単に走る
python train.py -c config.yml