Deepaudio-TTS-это структура для обучения моделей текста в речь (TTS) на основе нейронной сети. Это инкудеры или будут включать в себя популярные архитектуры нейронной сети для TTS и моделей Vocoder.
Чтобы облегчить использование различных функций, таких как смешанное назначение, обучение мульти-узлам, обучение TPU и т. Д., Я представил в этой структуре освещение и гидру Pytorch. Это все еще в разработке.
$ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata
Это личный проект. Так что у меня недостаточно ресурсов графического процессора, чтобы провести много экспериментов. Этот проект все еще находится в разработке. Я ценю любые отзывы или вклады. Пожалуйста, не стесняйтесь сделать Requsest для некоторых небольших проблем, таких как исправления ошибок, результаты эксперимента. Если у вас есть какие -либо вопросы, откройте проблему.
Я одолжил много кодов из речи ESPNet и Paddle