AiVoice
1.0.0
이것은 Deep Voice 3 : 2000-Speaker Neural Text-To-Steeech의 Tensorflow 구현입니다. 지금은 단일 스피커 합성에 중점을두고 있습니다.
LJ 음성 데이터 세트
LJ 음성 데이터 세트를 다운로드하여 압축 해제하십시오. 달리다:
python prepro.py
참고 : 데이터 세트를 동일한 prepro.py 의 폴더에 압축 해제했는지 확인하십시오.
그 후, 우리는 3 개의 새로운 폴더를 얻을 것입니다.
├── dones [New]
├── mags [New]
├── mels [New]
├── metadata.csv
├── README
└── wavs
교육 데이터는 ./LJSpeech-1.0/metadata.csv , ./LJSpeech-1.0/mels , ./LJSpeech-1.0/dones , ./LJSpeech-1.0/mags 에서로드됩니다. 로딩 경로를 변경하려면 class Hyperparams 에서 구성을 변경할 수 있습니다.
모델을 훈련시키기 위해이 명령을 사용합니다.
python train.py
현재 우리는 좋은 결과를 얻을 수 없습니다. 그러나 누군가가 관심이있는 경우에도 미리 훈련 된 모델을 여전히 제공합니다.
미리 훈련 된 모델.
관심 수치는 다음과 같습니다.
훈련시 생성 된 모든주의 수치는 미리 훈련 된 모델 ZIPPER 파일에 포함됩니다.
코드의 대부분은 Kyubyong/Deepvoice3에서 빌려 져 있습니다.