Deepmind의 Tacotron-2의 텐서 플로 구현. 이 논문에 설명 된 깊은 신경망 아키텍처 : Mel Spectogram 예측에 컨디셔닝 Wavenet에 의한 천연 TTS 합성
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
여기에는 몇 가지 합성 샘플이 있습니다.
여기서 사전에 사전 모델을 얻을 수 있습니다.
OS : 우분투 16.04
단계 (0) -Git 클론 저장소
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
단계 (1) - 종속성을 설치합니다
Python 3 (Python-3.5.5를위한 Python-3.5.5) 설치
Tensorflow 설치 (Tensorflow-1.10.0)
다른 종속성을 설치하십시오
pip install -r requirements.txt
단계 (2) - 데이터 세트 준비
데이터 세트 Biaobei 또는 THCHS-30을 다운로드하십시오
그 후, 당신의 문서 트리는 다음과 같아야합니다.
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
데이터 세트 준비 (기본값은 BIAOBEI )
python prepare_dataset.py
THCHS-30 준비하는 경우 매개 변수 --dataset=THCHS-30 사용할 수 있습니다.
그런 다음 다음과 같이 폴더 BIAOBEI 얻을 수 있습니다.
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
전처리 데이터 세트 (기본값은 BIAOBEI )
python preprocess.py
prrprocessing THCHS-30 인 경우 매개 변수 --dataset=THCHS-30 사용할 수 있습니다.
그런 다음 다음과 같이 폴더 training_data 얻을 수 있습니다.
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
단계 (3) - 타코트론 모델을 훈련시킵니다
python train.py
더 많은 매개 변수는 Train.py를 참조하십시오.
그런 다음 다음과 같이 폴더 logs-Tacotron 얻을 수 있습니다.
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
단계 (4) - 오디오 종합
python synthesize.py
더 많은 매개 변수는 synthesize.py를 참조하십시오.
그런 다음 다음과 같이 폴더 tacotron_output 얻을 수 있습니다.
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2