Implémentation de TensorFlow du Tacotron-2 de DeepMind. Une architecture de réseau neuronal profond décrit dans cet article: Synthèse TTS naturelle en conditionnant les prédictions du wavenet sur Mel Spectogram
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
Il existe des échantillons de synthèse ici.
Vous pouvez obtenir un modèle pré-entraîné ici.
OS: Ubuntu 16.04
Étape (0) - Référentiel Git Clone
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
Étape (1) - Installer les dépendances
Installez Python 3 (Python-3.5.5 pour moi)
Installez TensorFlow (Tensorflow-1.10.0 pour moi)
Installer d'autres dépendances
pip install -r requirements.txt
Étape (2) - Préparer un ensemble de données
Télécharger le jeu de données Biaobei ou THCHS-30
Après cela, votre arbre Doc devrait être:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
Préparer un ensemble de données (la valeur par défaut est BIAOBEI )
python prepare_dataset.py
Si vous préparez THCHS-30 , vous pouvez utiliser le paramètre --dataset=THCHS-30 .
Après cela, vous pouvez obtenir un dossier BIAOBEI comme suit:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
Ensemble de données de prétraitement (la valeur par défaut est BIAOBEI )
python preprocess.py
Si le procédure de THCHS-30 , vous pouvez utiliser le paramètre --dataset=THCHS-30 .
Après cela, vous pouvez obtenir un dossier training_data comme suit:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
Étape (3) - Train Tacotron Modèle
python train.py
Plus de paramètres, veuillez consulter Train.py.
Après cela, vous pouvez obtenir un logs-Tacotron comme suit:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
Étape (4) - Synthétiser l'audio
python synthesize.py
Plus de paramètres, veuillez consulter synthétisé.py.
Après cela, vous pouvez obtenir un dossier tacotron_output comme suit:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah / Tacotron-2