voicefixer_main
1.0.0
2021-11-06 : 이해하기 쉽도록 코드 구조를 업데이트했습니다. 지금은 잠재적 인 버그가있을 수 있습니다. 나중에 시험 훈련을하겠습니다.
2021-11-01 : 코드를 업데이트하고 나중에 더 쉽게 사용할 수 있도록하겠습니다.
VoiceFixer는 일반적인 음성 복원을위한 프레임 워크입니다. 우리는 심하게 타락한 연설과 역사적 연설의 회복을 목표로합니다.
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh 여기서 우리는 VF_UNET (분석 모듈로 UNET를 가진 VoiceFixer)를 예로 들어 본다.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your training체크 포인트, 로깅 및 유효성 검사 결과에 대해 Logs 디렉토리를 확인할 수 있습니다.
모든 테스트 세트에서 자동 평가 및 .CSV 파일 생성.
예를 들어, 모든 테스트 세트 (기본값)를 평가하려는 경우
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > 예를 들어, GSR 테스트 세트를 평가하려는 경우
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval 일반적으로 -테스트 세트 로 전달할 수있는 7 개의 테스트 세트가 있습니다.
그리고 소수의 데이터에 대해 평가하고 싶다면 10 발언. 숫자를 ---limit_numbers 인수로 전달할 수 있습니다.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 평가 결과는 Exp_Results 폴더에 제시됩니다.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json체크 포인트, 로깅 및 유효성 검사 결과에 대해 Logs 디렉토리를 확인할 수 있습니다.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >훈련
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.json체크 포인트, 로깅 및 유효성 검사 결과에 대해 Logs 디렉토리를 확인할 수 있습니다.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

