tts german pytorch 다운로드 -TTS tts german pytorch 소스 코드 다운로드

tts german pytorch

AI 소스 코드

1.0.0

다운로드

TTS-German-Pytorch

Fastpitch (Arxiv)는 Thorsten Müller의 Thorsten – 2022.10 및 Thorsten-21.06 감정적 데이터 세트에 대한 교육을 받았습니다.

오디오 샘플

여기에서 일부 오디오 샘플을들을 수 있습니다.

빠른 설정

필수 패키지 : torch torchaudio pyyaml phonemizer

phonemizer 및 espeak-ng 백엔드를 설치하려면 여기를 참조하십시오.

~ 훈련 : librosa matplotlib tensorboard

~ 데모 앱의 경우 : fastapi "uvicorn[standard]"

Fastpitch Model 링크의 사전 가중치를 다운로드하십시오.

Hifi-gan 보코더 가중치 (링크)를 다운로드하십시오. pretrained/hifigan-thor-v1 에 넣거나 configs/basic.yaml 에서 다음 줄을 편집하십시오.

 # vocoder
vocoder_state_path : pretrained/hifigan-thor-v1/hifigan-thor.pth
vocoder_config_path : pretrained/hifigan-thor-v1/config.json

모델 사용

models.fastpitch 의 FastPitch 텍스트 간 유험을 단순화하는 래퍼입니다. FastPitch2Wave 모델에는 직접 텍스트 음성 연설을위한 Hifi-gan 보코더가 포함되어 있습니다.

MEL 스펙트럼을 추론합니다

 from models . fastpitch import FastPitch
model = FastPitch ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
mel_spec = model . ttmel ( "Hallo Welt!" )

엔드 투 엔드 텍스트-음성

 from models . fastpitch import FastPitch2Wave
model = FastPitch2Wave ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
wave = model . tts ( "Hallo Welt!" )

wave_list = model . tts ([ "null" , "eins" , "zwei" , "drei" , "vier" , "fünf" ])