Скачать deepaudio tts - deepaudio tts Source Code скачать

deepaudio tts

AI Исходный код

1.0.0

Скачать

Что такое Deepaudio-TTS?

Deepaudio-TTS-это структура для обучения моделей текста в речь (TTS) на основе нейронной сети. Это инкудеры или будут включать в себя популярные архитектуры нейронной сети для TTS и моделей Vocoder.

Чтобы облегчить использование различных функций, таких как смешанное назначение, обучение мульти-узлам, обучение TPU и т. Д., Я представил в этой структуре освещение и гидру Pytorch. Это все еще в разработке.

Примеры обучения

Предварительно обрабатывать данные. (Скрипты в ближайшее время, или вы можете следовать учебному пособию по веслому речи для этого шага.)
Тренировать модель. Вы можете выбрать один эксперимент в Deepaudio/TTS/CLI/Configs/Experiment. Затем тренируйте модель следующими линиями:

 $ export PYTHONPATH="${PYTHONPATH}:/dir/of/this/project/"
$ python -m deepaudio.tts.cli.train experiment=tacotron2 datamodule.train_metadata=/you/path/to/train_metadata datamodule.dev_metadata=/you/path/to/dev_metadata

Поддерживаемые модели

Такотрон2
Fastspeech2
Трансформатор TTS
Параллельная волна
Хифиган
Вит

План будущего

Чистый код

Удалить избыточные коды.
Сделайте Deepaudio.tts.Models более чистыми.

Модели

Другие модели.
Предварительные модели.

Развертывание

Onnx
джит

Как внести свой вклад в Deepaudio-TTS

Это личный проект. Так что у меня недостаточно ресурсов графического процессора, чтобы провести много экспериментов. Этот проект все еще находится в разработке. Я ценю любые отзывы или вклады. Пожалуйста, не стесняйтесь сделать Requsest для некоторых небольших проблем, таких как исправления ошибок, результаты эксперимента. Если у вас есть какие -либо вопросы, откройте проблему.