Tacotron pytorch
1.0.0
Реализация Pytorch Tacotron: полностью сквозной модели синтеза текста в речь.

pip install -r requirements.txt
Я использовал набор данных LJSPEECH, который состоит из пар текстовых сценариев и файлов WAV. Полный набор данных (13 100 пар) можно загрузить здесь. Я направил https://github.com/keithito/tacotron для кода предварительной обработки.
hyperparams.py включает в себя все гипер -парамеры, которые необходимы.data.py загружает обучающие данные и предварительный текст для индекса и файлов WAV в спектрограмму. Коды предварительной обработки для текста находятся в текстовом/ каталоге.module.py содержит все методы, включая CBHG, шоссе, пренет и т. Д.network.py содержит сети, включая энкодер, декодер и сеть пост-обработки.train.py для обучения.synthesis.py предназначен для генерации образца TTS. hyperparams.py , особенно «data_path», который представляет собой каталог, который вы извлекаете файлы, и другие, если это необходимо.train.py . synthesis.py . Убедитесь, что шаг восстановления.