2021-11-06: لقد قمت فقط بتحديث بنية الكود لتسهيل فهمها. قد يكون لها خطأ محتمل الآن. سأقوم ببعض التدريب على الاختبار لاحقًا.
2021-11-01: سأقوم بتحديث الرمز وأسهل استخدامه لاحقًا.
VoiceFixer هو إطار لاستعادة الكلام العام. نحن نهدف إلى استعادة الكلام المتدهور الشديد والكلام التاريخي.
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh نحن هنا نأخذ VF_Unet (VoiceFixer مع UNET كوحدة تحليل) كمثال.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingيمكنك الخروج من دليل السجلات لنقاط التفتيش ونتائج التسجيل والتحقق من الصحة.
التقييم التلقائي وتوليد ملف .CSV على جميع الاختبارات.
على سبيل المثال ، إذا كنت ترغب في التقييم على جميع TestSet (افتراضي).
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > على سبيل المثال ، إذا كنت تريد فقط التقييم على اختبار GSR.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval هناك عمومًا سبعة اختبارات يمكنك نقلها إلى -الاختبار :
وإذا كنت ترغب في تقييم جزء صغير من البيانات ، مثل 10 الكلام. يمكنك تمرير الرقم إلى وسيطة -limit_numbers .
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 سيتم تقديم نتائج التقييم في مجلد exp_results .
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonيمكنك الخروج من دليل السجلات لنقاط التفتيش ونتائج التسجيل والتحقق من الصحة.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >تمرين
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonيمكنك الخروج من دليل السجلات لنقاط التفتيش ونتائج التسجيل والتحقق من الصحة.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

