tacotron2 mandarin
1.0.0
DeepMind的Tacotron-2的TensorFlow實現。本文描述的深度神經網絡架構:通過在MEL SPECTOGRAG預測上調節WaveNet的自然TTS綜合
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
這裡有一些合成樣本。
您可以在此處獲得預估計的模型。
OS:Ubuntu 16.04
步驟(0) - git克隆存儲庫
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
步驟(1) - 安裝依賴項
安裝Python 3(我為我python-3.5.5)
安裝TensorFlow(我的TensorFlow-1.10.0)
安裝其他依賴關係
pip install -r requirements.txt
步驟(2) - 準備數據集
下載數據集Biaobei或THCHS-30
之後,您的文檔樹應該是:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
準備數據集(默認為BIAOBEI )
python prepare_dataset.py
如果準備THCHS-30 ,則可以使用參數--dataset=THCHS-30 。
之後,您可以獲得一個文件夾BIAOBEI如下:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
預處理數據集(默認為BIAOBEI )
python preprocess.py
如果PRRPRRPRROCESS- THCHS-30 ,您可以使用參數--dataset=THCHS-30 。
之後,您可以獲得一個文件夾training_data如下:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
步驟(3) - 火車TACOTRON模型
python train.py
更多參數,請參閱train.py。
之後,您可以獲得一個文件夾logs-Tacotron如下:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
步驟(4) - 合成音頻
python synthesize.py
更多參數,請參閱Synthesize.py。
之後,您可以獲取一個文件夾tacotron_output如下:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2