DeepMindのTacotron-2のTensorflow実装。このペーパーで説明されている深いニューラルネットワークアーキテクチャ:メル分解予測に波線を条件付けることによる天然TTS合成
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
ここにはいくつかの合成サンプルがあります。
ここで前提型モデルを入手できます。
OS:Ubuntu 16.04
ステップ(0) - gitクローンリポジトリ
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
ステップ(1) - 依存関係をインストールします
Python 3をインストールします(Python-3.5.5私のために)
Tensorflow(Tensorflow-1.10.0のためにインストール)
他の依存関係をインストールします
pip install -r requirements.txt
ステップ(2) - データセットを準備します
Dataset biaobeiまたはthchs-30をダウンロードします
その後、あなたのドキュメントツリーは次のとおりです。
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
データセットの準備(デフォルトはBIAOBEIです)
python prepare_dataset.py
THCHS-30を準備する場合は、パラメーター--dataset=THCHS-30を使用できます。
その後、次のようにフォルダーBIAOBEIを取得できます。
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
プリプロセスデータセット(デフォルトはBIAOBEIです)
python preprocess.py
prrprprocessing THCHS-30の場合、パラメーター--dataset=THCHS-30を使用できます。
その後、次のようにフォルダーtraining_dataを取得できます。
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
ステップ(3) - タコトロンモデルをトレーニングします
python train.py
その他のパラメーター、train.pyを参照してください。
その後、次のようにフォルダーlogs-Tacotronを取得できます。
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
ステップ(4) - オーディオを合成します
python synthesize.py
その他のパラメーター、Synthesize.pyを参照してください。
その後、次のようにフォルダーtacotron_outputを取得できます。
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2