การใช้งาน Pytorch ของ (ACM MM'21) หลายนักร้อง: เสียงร้องร้องเพลงหลายร้องที่รวดเร็วพร้อมคลังข้อมูลขนาดใหญ่
ดูข้อกำหนดในข้อกำหนด. txt:
ใช้จุดตรวจของเราหรือ
นอกจากนี้คุณยังสามารถฝึกอบรมตัวเข้ารหัสด้วยตัวเองที่นี่และตั้งค่า enc_model_fpath ใน config/config.yaml โปรดตั้งค่าพารามิเตอร์เป็นตัวใน encoder/params_data และ encoder/params_model
สารสกัดจาก mel-spectrogram
python preprocess . py - i data / wavs - o data / feature - c config / config . yaml -i โฟลเดอร์เสียงของคุณ
-o โฟลเดอร์คุณสมบัติอะคูสติกเอาท์พุท
-c ไฟล์กำหนดค่า
การฝึกอบรมปรับอากาศบน mel-spectrogram
python train . py - i data / feature - o checkpoints / - - config config / config . yaml -i โฟลเดอร์ฟีเจอร์อะคูสติก
-o Directory เพื่อบันทึกจุดตรวจ
-c ไฟล์กำหนดค่า
python inference . py - i data / feature - o outputs / - c checkpoints / * . pkl - g config / config . yaml -i โฟลเดอร์ฟีเจอร์อะคูสติก
-o Directory เพื่อบันทึกคำพูดที่สร้างขึ้น
-c CHECKPOINTS FILE
-c ไฟล์กำหนดค่า
สำหรับการสังเคราะห์เสียงร้องเพลง:
ได้รับการฝึกฝนเกี่ยวกับ opensinger
GE2E
Fastspeech 2
Wavegan คู่ขนาน
@inproceedings{huang2021multi,
title={Multi-Singer: Fast Multi-Singer Singing Voice Vocoder With A Large-Scale Corpus},
author={Huang, Rongjie and Chen, Feiyang and Ren, Yi and Liu, Jinglin and Cui, Chenye and Zhao, Zhou},
booktitle={Proceedings of the 29th ACM International Conference on Multimedia},
pages={3945--3954},
year={2021}
}
อย่าลังเลที่จะติดต่อฉันที่ [email protected]