Deepaudio-TTS ist ein Rahmen für die Schulung von TTS-Modellen (TTS) für neuronale Netzwerke. Es gibt oder umfasst beliebte neuronale Netzwerkarchitekturen für TTS- und Vocoder -Modelle.
Um verschiedene Funktionen wie Mischprezision, Multi-Knoten-Training und TPU-Training usw. einfach zu verwenden, habe ich Pytorch-Lighting und Hydra in diesen Rahmen eingeführt. Es ist noch in der Entwicklung.
$ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata
Es ist ein persönliches Projekt. Ich habe also nicht genug GPU -Ressourcen, um viele Experimente durchzuführen. Dieses Projekt ist noch in der Entwicklung. Ich schätze jede Art von Feedback oder Beiträgen. Bitte können Sie sich frei machen, um einige kleine Probleme wie Fehlerbehebungen und Experimentergebnisse zu erreichen. Wenn Sie Fragen haben, öffnen Sie bitte ein Problem.
Ich habe viele Codes von ESPNET- und Paddle -Sprache geliehen