AiVoice
1.0.0
這是深度語音3:2000揚聲器神經文本到語音的張量實現。目前,我們只是專注於單揚聲器的綜合。
LJ語音數據集
下載並解開LJ語音數據集。跑步:
python prepro.py
注意:請確保我們將數據集解壓縮到prepro.py的同一foler中。
之後,我們將獲得三個新文件夾:
├── dones [New]
├── mags [New]
├── mels [New]
├── metadata.csv
├── README
└── wavs
./LJSpeech-1.0/mags數據從./LJSpeech-1.0/metadata.csv ./LJSpeech-1.0/mels ./LJSpeech-1.0/dones 。如果我們想更改加載路徑,我們可以更改class Hyperparams中的配置。
要訓練模型,我們使用此命令:
python train.py
目前,我們無法取得好成績。但是,我們仍然提供我們的預培訓模型,以防有人對此感興趣。
預訓練模型。
它的注意數如下:
在訓練中產生的所有註意數字都包含在預訓練的模型zpiped文件中。
大部分代碼都是從Kyubyong/DeepVoice3借來的。