tf diffwaveダウンロードtf diffwaveソースコードのダウンロード

tf diffwave

AI ソースコード

ve: channels=64, T=20, 1M steps

ダウンロード

tf-diffwave

（非公式）DiffwaveのTensorflow実装（Zhifeng Kong et al。、2020）

diffwave：オーディオ合成のための汎用性の高い拡散モデル、Zhifeng Kong et al。、2020。[Arxiv：2009.09761]

要件

Python 3.7.3 Conda Environment、Recomations.txtでテストされています

使用法

LJスピーチデータセットをダウンロードするには、スクリプトの下で実行します。

データセットは、tfrecord形式で「〜/tensorflow_datasets」でダウンロードされます。ダウンロードディレクトリを変更する場合は、 LJSpeech initializerのdata_dirパラメーターを指定します。

 from dataset import LJSpeech
from dataset . config import Config

config = Config ()
# lj = LJSpeech(config, data_dir=path, download=True)
lj = LJSpeech ( config , download = True )

モデルをトレーニングするには、train.pyを実行します。

チェックポイントは、 TrainConfig.ckpt 、 TrainConfig.logのテンソルボードの概要に記述されます。

python train.py
tensorboard --logdir ./log/

RAWオーディオからモデルをトレーニングする場合は、オーディオディレクトリを指定し、フラグをオンにします--from-raw 。

python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw

以前のチェックポイントからトレーニングを開始するには、 --load-stepが利用可能です。

python . t rain.py --load-step 416 --config ./ckpt/q1.json

実験の場合、参照expr.ipynb。

推論テストセットに、inderence.pyを実行します。

python . i nference.py

事前に保護されたチェックポイントは、リリースに関連しています。

前処理されたモデルを使用するには、ファイルをダウンロードして解凍します。適切なコミットタグとフォローへのgitリポジトリをチェックアウトします。サンプルスクリプトです。

 with open ( 'l1.json' ) as f :
    config = Config . load ( json . load ( f ))

diffwave = DiffWave ( config . model )
diffwave . restore ( './l1/l1_1000000.ckpt-1' ). expect_partial ()