tf glow tts
Glow-TTS POC
(非官方)在2020年Neurips的Jaehyheon Kim等人的Glow-TTS的張力實現。
在python 3.8.5 Windows10 conda環境,需求.txt中測試
要下載LJ-Speech數據集,請在腳本下運行。
數據集將以tfrecord格式以'〜/tensorflow_datasets下載。如果要更改下載目錄,請指定LJSpeech初始化器的data_dir參數。
from dataset . ljspeech import LJSpeech
# lj = LJSpeech(data_dir=path, download=True)
lj = LJSpeech ( download = True ) 要訓練型號,請運行train.py。
CheckPoint將寫在TrainConfig.ckpt上,張量列表TrainConfig.log 。
python train.py
tensorboard --logdir . l og如果您想從RAW AUDIO訓練模型,請指定音頻目錄並打開標誌--from-raw 。
python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw為了開始從以前的檢查點進行訓練,可以使用--load-epoch 。
python . t rain.py --load-epoch 20 --config D: t f c kpt g lowtts.json要推斷音頻,請運行temprence.py。
由於此代碼適用於POC,因此只有字母和幾個特殊字符可用,請參考文本Normalizer.Graphemes。
python . i nference.py
--config D: t f c kpt g lowtts.json
--ckpt D: t f c kpt g lowtts g lowtts_20.ckpt-1
--text " Hello, my name is revsic "預處理的檢查站將在版本上重新介紹。
要使用預估計的模型,請下載文件並解壓縮。以下是示例腳本。
from config import Config
from glowtts import GlowTTS
with open ( 'glowtts.json' ) as f :
config = Config . load ( json . load ( f ))
tts = GlowTTS ( config . model )
tts . restore ( './glowtts_20.ckpt-1' ). expect_partial ()訓練LJSpeech 20個帶有TF-Diffwave的時代


參考https://revsic.github.io/tf-glow-tts。