melgan multi
1.0.0
Implementación de Pytorch de Melgan: redes adversas generativas para la síntesis de forma de onda condicional.
Esta implementación incluye soporte distribuido y utiliza el conjunto de datos LJSPEECH.
data/LJSpeech-1.1/wavs python train.py --config=config.json --cps=cp_melgan El directorio de punto de control predeterminado es cp_melgan
Los registros de Tensorboard se guardarán en cp_melgan/logs
python distributed.py --config=config.json --args_str="--cps=cp_melgan"El código de entrenamiento detecta todas las GPU y las establece automáticamente.
Muestras actuales (489k pasos)
Muestras
El audio de muestra también se puede escuchar en la placa tensor. 
El espectrograma generado se puede ver en la placa tensor. 
Muy pronto..
Pronto cometeré un código de inferencia completo.
Me referí a Wavlow para implementar el preprocesamiento de audio.