DeepConvolutionalTTS pytorch download - DeepConvolutionalTTS pytorch source code download

Unduh

DCTTS (TTS Convolutional Deep) - Implementasi Pytorch

LJ Speech 1.1, dataset pembicara tunggal wanita.
Saya mengikuti repo DCTTS Kyubyong dengan TensorFlow untuk preprocessing data sinyal bicara. Ini benar -benar bekerja dengan baik.

Unduh dataset di atas dan ubah jalur di config.py. Dan kemudian jalankan perintah di bawah ini. Arg pertama: Sinyal Prepro, 2nd Arg: Metadata (Train/Test Split)
```
 python prepro.py 1 1
```
DCTTS memiliki dua model. Pertama, Anda harus melatih model Text2mel. Saya pikir langkah 20k sudah cukup (hanya satu jam). Tetapi Anda harus melatih model semakin banyak dengan kehilangan perhatian yang membusuk.
```
 python train.py 1 <gpu_id>
```
Kedua, latih SSRN. Output SSRN adalah banyak data resolusi tinggi. Jadi pelatihan ssrn lebih lambat dari pelatihan text2mel
```
 python train.py 2 <gpu_id>
```
Setelah pelatihan, Anda dapat mensintesis beberapa pidato dari teks.
```
 python synthesize.py <gpu_id>
```

Dalam sintesis bicara, modul perhatian penting. Jika model biasanya dilatih, maka Anda dapat melihat perhatian monotonik seperti gambar berikut.

To Do: Perhatian sebelumnya untuk inferensi.
Untuk melakukan: Mengurangi overfitting.
Di koran, mereka tidak merujuk normalisasi. Jadi saya menggunakan normalisasi berat badan seperti DeepVoice3.
Beberapa hiperparameter berbeda.
Jika Anda ingin meningkatkan kinerja, Anda harus menggunakan semua data. Untuk beberapa percobaan yang berbeda, saya memisahkan set pelatihan dan set validasi.