melgan multi
1.0.0
Реализация Pytorch Melgan: генеративные состязательные сети для условного синтеза формы волны.
Эта реализация включает в себя распределенную поддержку и использует набор данных LJSPEECH.
data/LJSpeech-1.1/wavs python train.py --config=config.json --cps=cp_melgan Каталог контрольных точек по умолчанию - cp_melgan
Журналы Tensorboard будут сохранены в cp_melgan/logs
python distributed.py --config=config.json --args_str="--cps=cp_melgan"Код обучения обнаруживает все графические процессоры и автоматически устанавливает их.
Образцы тока (489 тысяч шагов)
Образцы
Образец аудио можно услышать также на тензорке.
Сгенерированная спектрограмма можно увидеть на тензорке.
Вскоре..
В ближайшее время я сделаю полный код вывода.
Я сослался на WaveGlow для реализации предварительной обработки звука.