DeepConvolutionalTTS pytorch Download - DeepConvolutionalTTS pytorch Quellcode Download

Herunterladen

DCTTS (Deep Figolational TTS) - Pytorch -Implementierung

LJ Speech 1.1, weiblicher Einzelsprecher -Datensatz.
Ich folge Kyubyongs DCTTS -Repo mit Tensorflow für die Vorverarbeitung Sprachsignaldaten. Es hat tatsächlich gut funktioniert.

Laden Sie den obigen Datensatz herunter und ändern Sie den Pfad in config.py. Und dann den folgenden Befehl ausführen. 1. ARG: Signalprepro, 2. Arg: Metadaten (Zug/Testsplit)
```
 python prepro.py 1 1
```
DCTTS hat zwei Modelle. Zunächst sollten Sie das Modell Text2mel trainieren. Ich denke, dieser 20k -Schritt ist ausreichend (nur eine Stunde). Aber Sie sollten das Modell immer mehr mit verfallener geführter Aufmerksamkeitsverlust trainieren.
```
 python train.py 1 <gpu_id>
```
Zweitens trainieren Sie die SSRN. Die Ausgänge von SSRN sind viele hochauflösende Daten. Das Training von SSRN ist also langsamer als Training Text2Mel
```
 python train.py 2 <gpu_id>
```
Nach dem Training können Sie eine Sprache aus dem Text synthetisieren.
```
 python synthesize.py <gpu_id>
```

In der Sprachsynthese ist das Aufmerksamkeitsmodul wichtig. Wenn das Modell normalerweise trainiert ist, können Sie die monotonische Aufmerksamkeit wie die folgenden Zahlen sehen.

Zu tun: vorherige Aufmerksamkeit für Inferenz.
Zu tun: die Überanpassung lindern.
In der Arbeit haben sie keine Normalisierung bezogen. Also habe ich Gewichtnormalisierung wie DeepVoice3 verwendet.
Einige Hyperparameter sind unterschiedlich.
Wenn Sie die Leistung verbessern möchten, sollten Sie alle Daten verwenden. Für einige verschiedene Experimente habe ich den Trainingssatz und den Validierungssatz getrennt.