Pytorch-Implementierung von (ACM MM'21) Multi-Sänger: Schneller Multi-Sänger-Gesangs-Sprachvokoder mit einem großen Korpus.
Siehe Anforderungen in Anforderung.txt:
Nutzen Sie unseren Kontrollpunkt oder
Sie können den Encoder auch hier selbst trainieren und den enc_model_fpath in config/config.yaml festlegen. Bitte setzen Sie Params wie die in encoder/params_data und encoder/params_model ein.
Melspektrogramm extrahieren
python preprocess . py - i data / wavs - o data / feature - c config / config . yaml -i dein Audioordner
-o Ausgang Akustikfunktionsordner
-c -Konfigurationsdatei
Training auf melspektrogramm konditioniert
python train . py - i data / feature - o checkpoints / - - config config / config . yaml -i akustischer Funktionsordner
-o Verzeichnis zum Speichern von Kontrollpunkten
-c -Konfigurationsdatei
python inference . py - i data / feature - o outputs / - c checkpoints / * . pkl - g config / config . yaml -i akustischer Funktionsordner
-o Verzeichnis zum Speichern erzeugter Sprache
-c -Checkpoints -Datei
-c -Konfigurationsdatei
Zum Singen der Sprachsynthese:
Auf Opensinger ausgebildet
Ge2e
Fastspeech 2
Paralleler Wavegan
@inproceedings{huang2021multi,
title={Multi-Singer: Fast Multi-Singer Singing Voice Vocoder With A Large-Scale Corpus},
author={Huang, Rongjie and Chen, Feiyang and Ren, Yi and Liu, Jinglin and Cui, Chenye and Zhao, Zhou},
booktitle={Proceedings of the 29th ACM International Conference on Multimedia},
pages={3945--3954},
year={2021}
}
Fühlen Sie sich frei, mich unter [email protected] zu kontaktieren