melgan
voiced segment (fix #30, #17)
Melgan Vocoderの非公式Pytorch実装

Python 3.6でテストしました
pip install -r requirements.txtpython preprocess.py -c config/default.yaml -d [data's root path]yamlファイルを編集しますpython trainer.py -c [config yaml file] -n [name of the run]cp config/default.yaml config/config.yaml 、次にconfig.yamlを編集します*.melファイルを持つ*.wavのペアを含める必要があります。tensorboard --logdir logs/ Google Colab:Todoでお試しください
import torch
vocoder = torch . hub . load ( 'seungwonpark/melgan' , 'melgan' )
vocoder . eval ()
mel = torch . randn ( 1 , 80 , 234 ) # use your own mel-spectrogram here
if torch . cuda . is_available ():
vocoder = vocoder . cuda ()
mel = mel . cuda ()
with torch . no_grad ():
audio = vocoder . inference ( mel )python inference.py -p [checkpoint path] -i [input mel path] http://swpark.me/melgan/のオーディオサンプルを参照してください。モデルは、ljspeech-1.1を使用して14日間V100 GPUで訓練されました。

BSD 3-Clauseライセンス。