pytorch dc tts
1.0.0
Реализация Pytorch эффективно обучаемой системы текста в речь, основанная на глубоких сверточных сетях, с помощью внимания, основанного на следующих проектах:
Следующие записные книжки исполняются на https://colab.research.google.com:
Для пробы аудио и моделей, предварительно подготовленных, посетите приведенные выше ссылки на ноутбуке.
Английский TTS использует набор данных LJ-Speech.
python dl_and_preprop_dataset.py --dataset=ljspeechpython train-text2mel.py --dataset=ljspeechpython train-ssrn.py --dataset=ljspeechpython synthesize.py --dataset=ljspeechsamples . Монгольский текст в речь использует 5-часовой звук из Монгольской Библии.
python dl_and_preprop_dataset.py --dataset=mbspeechpython train-text2mel.py --dataset=mbspeechpython train-ssrn.py --dataset=mbspeechpython synthesize.py --dataset=mbspeechsamples .