Implementación de TensorFlow de Tacotron-2 de Deepmind. Una arquitectura de red neuronal profunda descrita en este documento: síntesis de TTS natural acondicionando Wavenet en predicciones de Mel Spectogram
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
Hay algunas muestras de síntesis aquí.
Puede obtener el modelo previamente provocado aquí.
OS: Ubuntu 16.04
Paso (0) - Repositorio de clones Git
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
Paso (1) - Instalar dependencias
Instale Python 3 (Python-3.5.5 para mí)
Instale TensorFlow (TensorFlow-1.10.0 para mí)
Instalar otras dependencias
pip install -r requirements.txt
Paso (2) - Prepare el conjunto de datos
Descargar DataSet Biaobei o THCHS-30
Después de eso, su árbol de doctor debería ser:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
Preparar el conjunto de datos (el valor predeterminado es BIAOBEI )
python prepare_dataset.py
Si prepara THCHS-30 , puede usar el parámetro --dataset=THCHS-30 .
Después de eso, puede obtener una carpeta BIAOBEI de la siguiente manera:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
Conjunto de datos de preprocesos (el valor predeterminado es BIAOBEI )
python preprocess.py
Si prrRprocessing THCHS-30 , puede usar el parámetro --dataset=THCHS-30 .
Después de eso, puede obtener una carpeta de training_data de la siguiente manera:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
Paso (3) - Modelo de Tacotron de tren
python train.py
Más parámetros, consulte Train.py.
Después de eso, puede obtener una carpeta logs-Tacotron de la siguiente manera:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
Paso (4) - Sintetizar audio
python synthesize.py
Más parámetros, consulte synthesize.py.
Después de eso, puede obtener una carpeta tacotron_output de la siguiente manera:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2