Внедрение Tensorflow такотрона-2 DeepMind. Глубокая архитектура нейронной сети, описанная в этой статье: синтез естественного TTS путем кондиционирования Wavenet на предсказаниях Spectogram MEL
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
Здесь есть некоторые образцы синтеза.
Вы можете получить предварительную модель здесь.
ОС: Ubuntu 16.04
Шаг (0) - репозиторий клона GIT
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
Шаг (1) - установить зависимости
Установите Python 3 (Python-3.5.5 для меня)
Установите TensorFlow (TensorFlow-1.10.0 для меня)
Установите другие зависимости
pip install -r requirements.txt
Шаг (2) - Подготовьте набор данных
Загрузить набор данных Biobei или THCHS-30
После этого ваше дерево документа должно быть:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
Подготовьте набор данных (по умолчанию BIAOBEI )
python prepare_dataset.py
Если подготовить THCHS-30 , вы можете использовать параметр --dataset=THCHS-30 .
После этого вы можете получить папку BIAOBEI следующим образом:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
Набор данных предварительной обработки (по умолчанию BIAOBEI )
python preprocess.py
Если PRRProcessing THCHS-30 , вы можете использовать параметр --dataset=THCHS-30 .
После этого вы можете получить папку training_data следующим образом:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
Шаг (3) - модель такотрона поезда
python train.py
Больше параметров, см. Train.py.
После этого вы можете получить logs-Tacotron следующим образом:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
Шаг (4) - синтезировать звук
python synthesize.py
Больше параметров, см. Synthesize.py.
После этого вы можете получить папку tacotron_output следующим образом:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2