2021-11-06: Saya baru saja memperbarui struktur kode untuk membuatnya lebih mudah dipahami. Mungkin ada potensi bug sekarang. Saya akan melakukan beberapa pelatihan tes nanti.
2021-11-01: Saya akan memperbarui kode dan membuatnya lebih mudah digunakan nanti.
Voicefixer adalah kerangka kerja untuk restorasi pidato umum. Kami bertujuan untuk memulihkan pidato yang sangat terdegradasi dan pidato sejarah.
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh Di sini kami mengambil VF_Unet (voicefixer dengan modul analisis yang tidak sesuai) sebagai contoh.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingAnda dapat memeriksa direktori log untuk pos pemeriksaan, logging dan validasi.
Evaluasi otomatis dan pembuatan file .csv pada semua testset.
Misalnya, jika Anda ingin mengevaluasi semua testset (default).
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > Misalnya, jika Anda hanya ingin mengevaluasi testset GSR.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval Umumnya ada tujuh testset yang dapat Anda lewati -testset :
Dan jika Anda ingin mengevaluasi sebagian kecil data, misalnya 10 ucapan. Anda dapat meneruskan nomor tersebut ke ---limit_numbers argumen.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 Hasil evaluasi akan disajikan dalam folder Exp_Results .
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonAnda dapat memeriksa direktori log untuk pos pemeriksaan, logging dan validasi.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >Pelatihan
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonAnda dapat memeriksa direktori log untuk pos pemeriksaan, logging dan validasi.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

