melgan multi
1.0.0
Implémentation de Pytorch de MELGAN: réseaux adversaires génératifs pour la synthèse de la forme d'onde conditionnelle.
Cette implémentation comprend une prise en charge distribuée et utilise l'ensemble de données LJSpeech.
data/LJSpeech-1.1/wavs python train.py --config=config.json --cps=cp_melgan Le répertoire de point de contrôle par défaut est cp_melgan
Les journaux de tensorboard seront enregistrés dans cp_melgan/logs
python distributed.py --config=config.json --args_str="--cps=cp_melgan"Le code de formation détecte tous les GPU et les définit automatiquement.
Échantillons actuels (étapes de 489k)
Échantillons
L'échantillon audio peut également être entendu sur le tensorboard. 
Le spectrograt généré peut être vu sur le Tensorboard. 
À venir..
Je vais bientôt commettre un code d'inférence complet.
J'ai fait référence à Wave Glow pour implémenter le prétraitement audio.