Implementasi PyTorch dari (ACM MM'21) Multi-Singer: Vocoder suara bernyanyi multi-penyanyi cepat dengan korpus skala besar.
Lihat persyaratan di persyaratan.txt:
Gunakan pos pemeriksaan kami, atau
Anda juga dapat melatih encoder sendiri di sini, dan mengatur enc_model_fpath di config/config.yaml. Harap atur params sebagai yang ada di encoder/params_data dan encoder/params_model .
Ekstrak Mel-Spectrogram
python preprocess . py - i data / wavs - o data / feature - c config / config . yaml -i folder audio Anda
-o output folder fitur akustik
-c file konfigurasi
Pelatihan dikondisikan pada Mel-Spectrogram
python train . py - i data / feature - o checkpoints / - - config config / config . yaml -i folder fitur akustik
-o direktori untuk menyimpan pos pemeriksaan
-c file konfigurasi
python inference . py - i data / feature - o outputs / - c checkpoints / * . pkl - g config / config . yaml -i folder fitur akustik
-o direktori untuk menyimpan pidato yang dihasilkan
-c file pos pemeriksaan
-c file konfigurasi
Untuk menyanyikan sintesis suara:
Dilatih di OpenSinger
Ge2e
Fastspeech 2
Paralel Wavegan
@inproceedings{huang2021multi,
title={Multi-Singer: Fast Multi-Singer Singing Voice Vocoder With A Large-Scale Corpus},
author={Huang, Rongjie and Chen, Feiyang and Ren, Yi and Liu, Jinglin and Cui, Chenye and Zhao, Zhou},
booktitle={Proceedings of the 29th ACM International Conference on Multimedia},
pages={3945--3954},
year={2021}
}
Jangan ragu untuk menghubungi saya di [email protected]