Transformer TTS
1.0.0

pip install -r requirements.txt





아래에서 생성 된 샘플을 확인할 수 있습니다. 모든 샘플은 160k의 단계이므로 모델이 아직 수렴되지 않았다고 생각합니다. 이 모델은 긴 문장에서 성능이 낮은 것으로 보입니다.
첫 번째 플롯은 예측 된 Mel 스펙트로 그램이고 두 번째 플롯은 지상 진실입니다.


hyperparams.py 에는 필요한 모든 하이퍼 매개 변수가 포함되어 있습니다.prepare_data.py preprocess wav 파일은 선형 스펙트로 그램으로 Mel, 더 빠른 교육 시간을 절약합니다. 텍스트의 전처리 코드는 텍스트/ 디렉토리에 있습니다.preprocess.py 데이터를로드 할 때 모든 전처리 코드가 포함되어 있습니다.module.py 에는주의, Prenet, Postnet 등을 포함한 모든 방법이 포함되어 있습니다.network.py 에는 인코더, 디코더 및 사후 처리 네트워크를 포함한 네트워크가 포함되어 있습니다.train_transformer.py 는 자동 회귀주의 네트워크를 훈련하기위한 것입니다. (텍스트 -> mel)train_postnet.py 포스트 네트워크를 훈련하기위한 것입니다. (mel-> 선형)synthesis.py TTS 샘플을 생성하기위한 것입니다. hyperparams.py , 특히 'data_path'에서 하이퍼 파라미터를 조정하여 파일을 추출하는 디렉토리와 필요한 경우 다른 디렉토리를 조정하십시오.prepare_data.py 실행하십시오.train_transformer.py 실행하십시오.train_postnet.py 실행하십시오. synthesis.py 실행하십시오. 복원 단계를 확인하십시오.