2021-11-06: Acabo de actualizar la estructura del código para que sea más fácil de entender. Puede tener un error potencial ahora. Haré un poco de entrenamiento de pruebas más tarde.
2021-11-01: Actualizaré el código y haré que sea más fácil de usar más adelante.
VoiceFixer es un marco para la restauración general del habla. Apuntamos a la restauración del habla severamente degradada y el discurso histórico.
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh Aquí tomamos VF_UNET (VoiceFixer con UneT as Analyse Module) como ejemplo.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingPuede consultar el directorio de registros para obtener resultados de puntos de control, registro y validación.
Evaluación automática y generación del archivo .csv en todos los conjuntos de pruebas.
Por ejemplo, si desea evaluar en todas las pruebas (predeterminado).
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > Por ejemplo, si solo quieres evaluar en GSR TestSet.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval Generalmente hay siete conjuntos de pruebas que puede pasar a - -testset :
Y si desea evaluar en una pequeña porción de datos, por ejemplo, 10 enunciado. Puede pasar el número al argumento --limit_numbers .
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 Los resultados de la evaluación se presentarán en la carpeta Exp_Results .
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonPuede consultar el directorio de registros para obtener resultados de puntos de control, registro y validación.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >Capacitación
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonPuede consultar el directorio de registros para obtener resultados de puntos de control, registro y validación.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

