2021-11-06: Ich habe gerade die Codestruktur aktualisiert, um das Verständnis zu erleichtern. Es kann jetzt potenziellen Fehler haben. Ich werde später ein Testtraining durchführen.
2021-11-01: Ich werde den Code aktualisieren und die spätere Verwendung erleichtern.
VoiceFixer ist ein Rahmen für die allgemeine Redewiederherstellung. Wir zielen darauf ab, die Wiederherstellung stark verschlechterter Sprache und historischer Sprache wiederherzustellen.
# Download dataset and prepare running environment
git clone https://github.com/haoheliu/voicefixer_main.git
cd voicefixer_main
source init.sh Hier nehmen wir VF_Unet (VoiceFixer mit UNET als Analysemodul) als Beispiel.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.json # you can modify the configuration file to personalize your trainingSie können das Protokoll -Verzeichnis für Checkpoints-, Protokollierungs- und Validierungsergebnisse auschecken.
Automatische Bewertung und Generierung von .csv -Datei für alle Testsets.
Wenn Sie beispielsweise auf allen Testset (Standard) bewerten möchten.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint > Zum Beispiel, wenn Sie nur auf GSR Testset bewerten möchten.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--testset general_speech_restoration
--description general_speech_restoration_eval Es gibt im Allgemeinen sieben Testsets, an die Sie übergeben werden können -Testset :
Und wenn Sie einen kleinen Teil der Daten bewerten möchten, z. B. 10 Äußerung. Sie können die Nummer an -limit_numbers Argument übergeben.
python3 eval_gsr_voicefixer.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers 10 Die Bewertungsergebnisse werden im Ordner Exp_Results dargestellt.
# pass in a configuration file to the training script
python3 train_gsr_voicefixer.py -c config/vctk_base_voicefixer_unet.jsonSie können das Protokoll -Verzeichnis für Checkpoints-, Protokollierungs- und Validierungsergebnisse auschecken.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test >Ausbildung
# pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_denoising.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_dereverberation.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_super_resolution.json # pass in a configuration file to the training script
python3 train_ssr_unet.py -c config/vctk_base_ssr_unet_declipping.jsonSie können das Protokoll -Verzeichnis für Checkpoints-, Protokollierungs- und Validierungsergebnisse auschecken.
python3 eval_ssr_unet.py
--config < path-to-the-config-file >
--ckpt < path-to-the-checkpoint >
--limit_numbers < int-test-only-on-a-few-utterance >
--testset < the-testset-you-want-to-use >
--description < describe-this-test > @misc { liu2021voicefixer ,
title = { VoiceFixer: Toward General Speech Restoration With Neural Vocoder } ,
author = { Haohe Liu and Qiuqiang Kong and Qiao Tian and Yan Zhao and DeLiang Wang and Chuanzeng Huang and Yuxuan Wang } ,
year = { 2021 } ,
eprint = { 2109.13731 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.SD }
}

