DiffWave Vocoder
1.0.0
이것은 Diffwave에서 신경 보코더의 상환입니다 : 오디오 합성을위한 다목적 확산 모델.
모델을 계속 훈련하려면 python distributed_train.py -c config_${channel}.json 실행하십시오. 여기서 ${channel} 64 또는 128 일 수 있습니다.
모델을 재교육하려면 해당 json 파일의 매개 변수 ckpt_iter -1 로 변경하고 위 명령을 사용하십시오.
오디오를 생성하려면 python inference.py -c config_${channel}.json -cond ${conditioner_name} 실행하십시오. 예를 들어, MEL 스펙트로 그램의 이름이 LJ001-0001.wav.pt 인 경우 ${conditioner_name} 은 LJ001-0001 입니다. MEL 스펙트로 그램에는 LJ001-0001 에서 LJ001-0186 포함합니다.
data_path 및 batch_size_per_gpu 와 같은 json 파일의 일부 매개 변수를주의 깊게 조정해야 할 수도 있습니다.