Tacotron pytorch Download - Tacotron pytorch Quellcode Download

Tacotron pytorch

AI-Quellcode

1.0.0

Herunterladen

Tacotron-Pytorch

Eine Pytorch-Implementierung von Tacotron: Ein vollständig End-to-End-Synthese-Modell von Text-to-Speech-Synthese.

Anforderungen

Installieren Sie Python 3
Installieren Sie Pytorch == 0.2.0
Anforderungen installieren:
```
 pip install -r requirements.txt
```

Daten

Ich habe einen LJSpeech -Datensatz verwendet, der aus Textpaaren von Textskript- und WAV -Dateien besteht. Der vollständige Datensatz (13.100 Paare) kann hier heruntergeladen werden. Ich habe https://github.com/keithito/tacotron für den Vorverarbeitungscode verwiesen.

Dateibeschreibung

hyperparams.py enthält alle benötigten Hyperparameter.
data.py lädt Trainingsdaten und Vorverarbeitungstext in die Index- und WAV -Dateien in das Spektrogramm. Die Vorverarbeitungscodes für Text befinden sich im Text/ Verzeichnis.
module.py enthält alle Methoden, einschließlich CBHG, Autobahn, Prenet usw.
network.py enthält Netzwerke wie Encoder, Decoder und Nachverarbeitungsnetzwerk.
train.py ist für das Training.
synthesis.py dient zur Erzeugung von TTS -Proben.

Training des Netzwerks

Schritt 1. Download und extrahieren Sie LJSpeech -Daten in jedem gewünschten Verzeichnis.
Schritt 2. Passen Sie die Hyperparameter in hyperparams.py an, insbesondere in "Data_Path", ein Verzeichnis, das Sie bei Bedarf und die anderen extrahieren.
Schritt 3. Run train.py .

Generieren Sie die TTS -WAV -Datei

Schritt 1. Ausführen synthesis.py . Stellen Sie sicher, dass der Wiederherstellungsschritt.

Proben

Sie können die generierten Proben im Verzeichnis von Proben/'überprüfen. Der Trainingsschritt betrug nur 60.000, daher ist die Leistung noch nicht gut.