Implementação do TensorFlow do Tacotron-2 de DeepMind. Uma arquitetura de rede neural profunda descrita neste artigo: síntese natural de TTS, condicionando o wavenet nas previsões de Mel Spectograma
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
Existem algumas amostras de síntese aqui.
Você pode obter um modelo pré -treinado aqui.
OS: Ubuntu 16.04
Etapa (0) - Repositório de clone Git
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
Etapa (1) - Instale dependências
Instale o Python 3 (Python-3.5.5 para mim)
Instale o tensorflow (tensorflow-1.10.0 para mim)
Instalar outras dependências
pip install -r requirements.txt
Etapa (2) - Prepare o conjunto de dados
Baixe o conjunto de dados biaobei ou thchs-30
Depois disso, sua árvore de documentos deve ser:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
Prepare o conjunto de dados (o padrão é BIAOBEI )
python prepare_dataset.py
Se a preparação THCHS-30 , você pode usar o parâmetro --dataset=THCHS-30 .
Depois disso, você pode obter uma pasta BIAOBEI da seguinte forma:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
Conjunto de dados de pré -processo (padrão é BIAOBEI )
python preprocess.py
Se o prrocessamento THCHS-30 , você poderá usar o parâmetro --dataset=THCHS-30 .
Depois disso, você pode obter uma pasta training_data da seguinte forma:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
Etapa (3) - Modelo de Treine Tacotron
python train.py
Mais parâmetros, consulte Train.py.
Depois disso, você pode obter uma pasta logs-Tacotron da seguinte forma:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
Etapa (4) - sintetize áudio
python synthesize.py
Mais parâmetros, consulte Synthesize.py.
Depois disso, você pode obter uma pasta tacotron_output da seguinte forma:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2