2021-11-06: Acabei de atualizar a estrutura de código para facilitar o entendimento. Pode ter um bug potencial agora. Farei algum treinamento de teste mais tarde.
2021-11-01: Atualizarei o código e facilitarei o uso posterior.
O VoiceFixer é uma estrutura para a restauração geral da fala. Nosso objetivo é a restauração de fala gravemente degradada e fala histórica.
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh Aqui, tomamos VF_UNET (VoiceFixer com o módulo de análise UNET como um exemplo.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingVocê pode verificar o diretório de logs para pontos de verificação, resultados de log e validação.
Avaliação automática e geração do arquivo .csv em todos os testes.
Por exemplo, se você deseja avaliar todo o teste de teste (padrão).
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > Por exemplo, se você só quiser avaliar no GSR TestSet.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval Geralmente, existem sete testes para os quais você pode passar -Testset :
E se você deseja avaliar uma pequena parte dos dados, por exemplo, 10 enunciado. Você pode passar o número para -LIMIT_NUMBERS .
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 Os resultados da avaliação serão apresentados na pasta Exp_Results .
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonVocê pode verificar o diretório de logs para pontos de verificação, resultados de log e validação.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >Treinamento
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonVocê pode verificar o diretório de logs para pontos de verificação, resultados de log e validação.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

