(Tidak resmi) Implementasi Tensorflow dari Glow-TTS, Jaehyeon Kim et al., Dalam Neurips 2020.
Diuji di Python 3.8.5 Windows10 Conda Environment, Persyaratan.txt
Untuk mengunduh dataset LJ-Speech, jalankan di bawah skrip.
Dataset akan diunduh di '~/tensorflow_datasets' dalam format tfrecord. Jika Anda ingin mengubah direktori unduhan, tentukan parameter data_dir dari LJSpeech initializer.
from dataset . ljspeech import LJSpeech
# lj = LJSpeech(data_dir=path, download=True)
lj = LJSpeech ( download = True ) Untuk melatih model, jalankan train.py.
Pos pemeriksaan akan ditulis di TrainConfig.ckpt , ringkasan Tensorboard di TrainConfig.log .
python train.py
tensorboard --logdir . l og Jika Anda ingin melatih model dari Audio Raw, tentukan Audio Directory dan nyalakan bendera --from-raw .
python . t rain.py --data-dir D: L JSpeech-1.1 w avs --from-raw Untuk mulai berlatih dari pos pemeriksaan sebelumnya, --load-epoch tersedia.
python . t rain.py --load-epoch 20 --config D: t f c kpt g lowtts.json Untuk inferensi audio, jalankan inference.py.
Karena kode ini untuk POC, hanya huruf dan beberapa karakter khusus yang tersedia, referensi TextNormalizer.graphemes.
python . i nference.py
--config D: t f c kpt g lowtts.json
--ckpt D: t f c kpt g lowtts g lowtts_20.ckpt-1
--text " Hello, my name is revsic "Pos pemeriksaan pretrain dirilis pada rilis.
Untuk menggunakan model pretrained, unduh file dan unzip. Berikut adalah skrip sampel.
from config import Config
from glowtts import GlowTTS
with open ( 'glowtts.json' ) as f :
config = Config . load ( json . load ( f ))
tts = GlowTTS ( config . model )
tts . restore ( './glowtts_20.ckpt-1' ). expect_partial ()Latih Ljspeech 20 Zaman dengan TF-Diffwave


Referensi https://revsic.github.io/tf-glow-tts.