(Non officiel) Implémentation de Tensorflow de Glow-TTS, Jaehyeon Kim et al., Dans Neirips 2020.
Testé dans Python 3.8.5 Windows10 Conda Environment, exigences.txt
Pour télécharger le jeu de données LJ-Speech, exécutez sous Script.
L'ensemble de données sera téléchargé dans «~ / Tensorflow_datasets» au format tfrecord. Si vous souhaitez modifier le répertoire de téléchargement, spécifiez le paramètre data_dir de l'initialisateur LJSpeech .
from dataset . ljspeech import LJSpeech
# lj = LJSpeech(data_dir=path, download=True)
lj = LJSpeech ( download = True ) Pour entraîner le modèle, exécutez Train.py.
Le point de contrôle sera écrit sur TrainConfig.ckpt , Tensorboard Résumé sur TrainConfig.log .
python train.py
tensorboard --logdir . l og Si vous souhaitez former le modèle à partir de RAW Audio, spécifiez le répertoire audio et activez l'indicateur --from-raw .
python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw Pour commencer à s'entraîner à partir du point de contrôle précédent, --load-epoch est disponible.
python . t rain.py --load-epoch 20 --config D: t f c kpt g lowtts.json Pour inférer l'audio, exécutez Inference.py.
Étant donné que ce code est pour POC, seuls les alphabets et plusieurs caractères spéciaux sont disponibles, référence textNormalizer.graphiemes.
python . i nference.py
--config D: t f c kpt g lowtts.json
--ckpt D: t f c kpt g lowtts g lowtts_20.ckpt-1
--text " Hello, my name is revsic "Les points de contrôle pré-entraînés sont relancés sur les versions.
Pour utiliser le modèle pré-entraîné, téléchargez des fichiers et décompressez-le. Les suivants sont un exemple de script.
from config import Config
from glowtts import GlowTTS
with open ( 'glowtts.json' ) as f :
config = Config . load ( json . load ( f ))
tts = GlowTTS ( config . model )
tts . restore ( './glowtts_20.ckpt-1' ). expect_partial ()Train LjSpeech 20 époques avec TF-Diffwave


Référence https://revsic.github.io/tf-glow-tts.