2021-11-06: ฉันเพิ่งอัปเดตโครงสร้างรหัสเพื่อให้เข้าใจได้ง่ายขึ้น มันอาจมีข้อผิดพลาดที่อาจเกิดขึ้นในขณะนี้ ฉันจะทำการฝึกทดสอบในภายหลัง
2021-11-01: ฉันจะอัปเดตรหัสและทำให้ใช้งานได้ง่ายขึ้นในภายหลัง
VoiceFixer เป็นกรอบสำหรับการฟื้นฟูการพูดทั่วไป เราตั้งเป้าหมายที่การฟื้นฟูคำพูดที่เสื่อมโทรมอย่างรุนแรงและการพูดทางประวัติศาสตร์
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh ที่นี่เราใช้ VF_UNET (VoiceFixer พร้อม UNET เป็นโมดูลการวิเคราะห์) เป็นตัวอย่าง
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingคุณสามารถชำระเงินไดเรกทอรี บันทึก สำหรับจุดตรวจสอบการบันทึกและผลการตรวจสอบความถูกต้อง
การประเมินและสร้างไฟล์. csv โดยอัตโนมัติในชุดทดสอบทั้งหมด
ตัวอย่างเช่นหากคุณต้องการประเมินในชุดทดสอบทั้งหมด (ค่าเริ่มต้น)
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > ตัวอย่างเช่นหากคุณต้องการประเมินในชุดทดสอบ GSR
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval โดยทั่วไปมีชุดทดสอบเจ็ดชุดที่คุณสามารถส่งไปยัง -ทดสอบรายการ :
และถ้าคุณต้องการประเมินข้อมูลส่วนเล็ก ๆ เช่น 10 คำพูด คุณสามารถส่งหมายเลขไปยัง -limit_numbers อาร์กิวเมนต์
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 ผลการประเมินจะถูกนำเสนอในโฟลเดอร์ exp_results
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonคุณสามารถชำระเงินไดเรกทอรี บันทึก สำหรับจุดตรวจสอบการบันทึกและผลการตรวจสอบความถูกต้อง
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >การฝึกอบรม
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonคุณสามารถชำระเงินไดเรกทอรี บันทึก สำหรับจุดตรวจสอบการบันทึกและผลการตรวจสอบความถูกต้อง
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

