(Inoffizielle) Tensorflow-Implementierung von Glow-TTs, Jaehyeon Kim et al., In Neurips 2020.
Getestet in Python 3.8.5 Windows10 Conda Umgebung, Anforderungen.txt
Um das LJ-Speech-Datensatz herunterzuladen, laufen Sie unter Skript aus.
Der Datensatz wird in '~/TensorFlow_Datasets' im TFRECORD -Format heruntergeladen. Wenn Sie das Download -Verzeichnis ändern möchten, geben Sie den Parameter data_dir von LJSpeech Initializer an.
from dataset . ljspeech import LJSpeech
# lj = LJSpeech(data_dir=path, download=True)
lj = LJSpeech ( download = True ) Um das Modell zu trainieren, rennen Sie Train.py.
Der Checkpoint wird auf TrainConfig.ckpt , Tensorboard -Zusammenfassung auf TrainConfig.log geschrieben.
python train.py
tensorboard --logdir . l og Wenn Sie das Modell aus RAW Audio trainieren möchten, geben Sie das Audioverzeichnis an und schalten Sie das Flag ein --from-raw .
python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw Um aus dem vorherigen Kontrollpunkt aus zu trainieren, ist --load-epoch verfügbar.
python . t rain.py --load-epoch 20 --config D: t f c kpt g lowtts.json Um das Audio zu verleiten, führen Sie Inference.py aus.
Da dieser Code für POC gilt, sind nur Alphabete und mehrere Sonderzeichen verfügbar, ReferenztextNormalizer.graphemes.
python . i nference.py
--config D: t f c kpt g lowtts.json
--ckpt D: t f c kpt g lowtts g lowtts_20.ckpt-1
--text " Hello, my name is revsic "Vorbereitete Checkpoints werden an Veröffentlichungen bezogen.
Laden Sie Dateien herunter und entpacken Sie es, um vorgezogene Modell zu verwenden. Die folgenden Anhänger sind ein Beispielskript.
from config import Config
from glowtts import GlowTTS
with open ( 'glowtts.json' ) as f :
config = Config . load ( json . load ( f ))
tts = GlowTTS ( config . model )
tts . restore ( './glowtts_20.ckpt-1' ). expect_partial ()train ljspeech 20 epochs mit tf-diffwave


Referenz https://revsic.github.io/tf-glow-tts.