DiffWave Vocoder
1.0.0
這是Diffwave中神經聲碼器的重新製作:音頻合成的多功能擴散模型。
要繼續訓練模型,請運行python distributed_train.py -c config_${channel}.json ,其中${channel}可以是64或128 。
要重新訓練模型,請將相應json文件中的參數ckpt_iter更改為-1 ,然後使用上述命令。
要生成音頻,請運行python inference.py -c config_${channel}.json -cond ${conditioner_name} 。例如,如果MEL頻譜圖的名稱是LJ001-0001.wav.pt ,則${conditioner_name}為LJ001-0001 。提供的MEL頻譜圖包括LJ001-0001至LJ001-0186 。
請注意,您可能需要仔細調整json文件中的某些參數,例如data_path和batch_size_per_gpu 。