voicefixer_main
1.0.0
2021-11-06:コード構造を更新して理解しやすくしました。今、潜在的なバグがあるかもしれません。後でテストトレーニングを行います。
2021-11-01:コードを更新し、後で使いやすくします。
VoiceFixerは、一般的な音声修復のフレームワークです。私たちは、ひどく劣化したスピーチと歴史的なスピーチの回復を目指しています。
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh ここでは、 vf_unet (UNETを備えたVoiceFixerを分析モジュールとして)と例に取ります。
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingチェックポイント、ログ、検証結果についてログディレクトリをチェックアウトできます。
すべてのテストセットで.csvファイルを自動評価し、生成します。
たとえば、すべてのテストセット(デフォルト)で評価したい場合。
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > たとえば、GSRテストセットで評価したい場合。
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval 通常、 - テストセットに渡すことができる7つのテストセットがあります:
また、データのごく一部を評価したい場合は、たとえば10発言。番号を-limit_numbers引数に渡すことができます。
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 評価結果は、 exp_resultsフォルダーに表示されます。
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonチェックポイント、ログ、検証結果についてログディレクトリをチェックアウトできます。
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >トレーニング
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonチェックポイント、ログ、検証結果についてログディレクトリをチェックアウトできます。
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

