tf diffwave
ve: channels=64, T=20, 1M steps
(非官方)diffwave的張力實現(Zhifeng Kong等,2020)
在Python 3.7.3 Conda環境中測試,需求.txt
要下載LJ-Speech數據集,請在腳本下運行。
數據集將以tfrecord格式以'〜/tensorflow_datasets下載。如果要更改下載目錄,請指定LJSpeech初始化器的data_dir參數。
from dataset import LJSpeech
from dataset . config import Config
config = Config ()
# lj = LJSpeech(config, data_dir=path, download=True)
lj = LJSpeech ( config , download = True ) 要訓練型號,請運行train.py。
CheckPoint將寫在TrainConfig.ckpt上,張量板摘要上的TrainConfig.log 。
python train.py
tensorboard --logdir ./log/如果您想從RAW AUDIO訓練模型,請指定音頻目錄並打開標誌--from-raw 。
python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw為了開始從以前的檢查點進行訓練,可以使用--load-step 。
python . t rain.py --load-step 416 --config ./ckpt/q1.json對於實驗,參考expr.ipynb。
轉換測試集,運行推薦。
python . i nference.py預處理的檢查站將在版本上重新介紹。
要使用預估計的模型,請下載文件並解壓縮。結帳git存儲庫適當的提交標籤和以下是示例腳本。
with open ( 'l1.json' ) as f :
config = Config . load ( json . load ( f ))
diffwave = DiffWave ( config . model )
diffwave . restore ( './l1/l1_1000000.ckpt-1' ). expect_partial ()Res.Channels = 64,T = 20,火車1M步。

參考https://revsic.github.io/tf-diffwave。