DiffWave Vocoder
1.0.0
这是Diffwave中神经声码器的重新制作:音频合成的多功能扩散模型。
要继续训练模型,请运行python distributed_train.py -c config_${channel}.json ,其中${channel}可以是64或128 。
要重新训练模型,请将相应json文件中的参数ckpt_iter更改为-1 ,然后使用上述命令。
要生成音频,请运行python inference.py -c config_${channel}.json -cond ${conditioner_name} 。例如,如果MEL频谱图的名称是LJ001-0001.wav.pt ,则${conditioner_name}为LJ001-0001 。提供的MEL频谱图包括LJ001-0001至LJ001-0186 。
请注意,您可能需要仔细调整json文件中的某些参数,例如data_path和batch_size_per_gpu 。