tf glow tts
Glow-TTS POC
(非官方)在2020年Neurips的Jaehyheon Kim等人的Glow-TTS的张力实现。
在python 3.8.5 Windows10 conda环境,需求.txt中测试
要下载LJ-Speech数据集,请在脚本下运行。
数据集将以tfrecord格式以'〜/tensorflow_datasets下载。如果要更改下载目录,请指定LJSpeech初始化器的data_dir参数。
from dataset . ljspeech import LJSpeech
# lj = LJSpeech(data_dir=path, download=True)
lj = LJSpeech ( download = True ) 要训练型号,请运行train.py。
CheckPoint将写在TrainConfig.ckpt上,张量列表TrainConfig.log 。
python train.py
tensorboard --logdir . l og如果您想从RAW AUDIO训练模型,请指定音频目录并打开标志--from-raw 。
python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw为了开始从以前的检查点进行训练,可以使用--load-epoch 。
python . t rain.py --load-epoch 20 --config D: t f c kpt g lowtts.json要推断音频,请运行temprence.py。
由于此代码适用于POC,因此只有字母和几个特殊字符可用,请参考文本Normalizer.Graphemes。
python . i nference.py
--config D: t f c kpt g lowtts.json
--ckpt D: t f c kpt g lowtts g lowtts_20.ckpt-1
--text " Hello, my name is revsic "预处理的检查站将在版本上重新介绍。
要使用预估计的模型,请下载文件并解压缩。以下是示例脚本。
from config import Config
from glowtts import GlowTTS
with open ( 'glowtts.json' ) as f :
config = Config . load ( json . load ( f ))
tts = GlowTTS ( config . model )
tts . restore ( './glowtts_20.ckpt-1' ). expect_partial ()训练LJSpeech 20个带有TF-Diffwave的时代


参考https://revsic.github.io/tf-glow-tts。