Chinese FastSpeech2
1.0.0
Biaobei Chinese의 표준 여성 음성 데이터를 기반으로 원래 논문의 Fastspeech2 모델이 개선되었으며 리듬 표현 및 리듬 예측 모듈이 도입되어 중국 발음을보다 생생하고 리듬을 만들었습니다.
샘플에서 생성 된 오디오를 참조하십시오
이 프로젝트의 주요 구조는 FastSpeech2+Hifigan 구조입니다. 또한, 중국어 텍스트의 리듬 벡터는 입력 단계에서 소개됩니다. 따라서 FastSpeech_Model, Hifigan_Model, Prosody_Model (Net Disk Link, Extraction Code : QGPI)의 세 가지 모델이 있습니다. 다운로드 후 모델 파일을 지정된 디렉토리에 넣습니다.
두 가지 예측 방법이 제공됩니다 : 1) Python synthesize_all.py; 2) HTTP 인터페이스 호출
이 프로젝트는 개인적인 관심사에서 음성 합성을 만들기위한 시도입니다. 모두가 나를 비판하고 수정하고 더 많은 의사 소통을 환영합니다!