Tacotron pytorch
1.0.0
타코트론의 Pytorch 구현 : 완전 엔드 투 엔드 텍스트 음성 연사 합성 모델.

pip install -r requirements.txt
텍스트 스크립트 쌍과 WAV 파일 쌍으로 구성된 ljspeech 데이터 세트를 사용했습니다. 전체 데이터 세트 (13,100 쌍)는 여기에서 다운로드 할 수 있습니다. 전처리 코드에 대해 https://github.com/keithito/tacotron을 언급했습니다.
hyperparams.py 에는 필요한 모든 하이퍼 매개 변수가 포함되어 있습니다.data.py 교육 데이터 및 전처리 텍스트를 색인 및 파일 파일로 스펙트로 그램으로로드합니다. 텍스트의 전처리 코드는 텍스트/ 디렉토리에 있습니다.module.py 에는 CBHG, Highway, Prenet 등을 포함한 모든 방법이 포함되어 있습니다.network.py 에는 인코더, 디코더 및 사후 처리 네트워크를 포함한 네트워크가 포함되어 있습니다.train.py 훈련을위한 것입니다.synthesis.py TTS 샘플을 생성하기위한 것입니다. hyperparams.py , 특히 'data_path'에서 하이퍼 파라미터를 조정하여 파일을 추출하는 디렉토리와 필요한 경우 다른 디렉토리를 조정하십시오.train.py 실행하십시오. synthesis.py 실행하십시오. 복원 단계를 확인하십시오.