melgan multi
1.0.0
Implementação de Melgan: redes adversárias generativas para síntese condicional de forma de onda.
Esta implementação inclui suporte distribuído e usa o conjunto de dados LJSpeech.
data/LJSpeech-1.1/wavs python train.py --config=config.json --cps=cp_melgan O diretório de ponto de verificação padrão é cp_melgan
Os registros de tensorboard serão salvos em cp_melgan/logs
python distributed.py --config=config.json --args_str="--cps=cp_melgan"O código de treinamento detecta todas as GPUs e as define automaticamente.
Amostras atuais (489k etapas)
Amostras
A amostra de áudio também pode ser ouvida no Tensorboard. 
O espectrograma gerado pode ser visto no Tensorboard. 
Em breve..
Vou cometer um código de inferência completo em breve.
Eu me referi ao WaveGlow para implementar o pré -processamento de áudio.