tts german pytorch Téléchargement allemand - tts german pytorch CODE SOURCE TÉLÉCHARGE

tts german pytorch

Code Source AI

1.0.0

Télécharger

tts-allemman-pytorch

Fastpitch (ARXIV) formé sur les ensembles de données Thorsten - 2022.10 et Thorsten-21.06 de Thorsten Müller.

Échantillons audio

Vous pouvez écouter quelques échantillons audio ici.

Configuration rapide

Packages requis: torch torchaudio pyyaml phonemizer

Veuillez vous référer à ICI pour installer phonemizer et le backend espeak-ng .

~ pour la formation: librosa matplotlib tensorboard

~ Pour l'application de démonstration: fastapi "uvicorn[standard]"

Téléchargez les poids pré-entraînés pour le lien du modèle FastPitch.

Téléchargez les poids de vocoder Hifi-gan (lien). Soit les mettre dans pretrained/hifigan-thor-v1 ou modifiez les lignes suivantes dans configs/basic.yaml .

 # vocoder
vocoder_state_path : pretrained/hifigan-thor-v1/hifigan-thor.pth
vocoder_config_path : pretrained/hifigan-thor-v1/config.json

En utilisant les modèles

Le FastPitch de models.fastpitch est un emballage qui simplifie l'inférence text-to-mel. Le modèle FastPitch2Wave comprend le vocodeur HIFI-GAN pour l'inférence directe du texte-dispection.

Déduire le spectrogramme MEL

 from models . fastpitch import FastPitch
model = FastPitch ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
mel_spec = model . ttmel ( "Hallo Welt!" )

Texte à disposition de bout en bout

 from models . fastpitch import FastPitch2Wave
model = FastPitch2Wave ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
wave = model . tts ( "Hallo Welt!" )

wave_list = model . tts ([ "null" , "eins" , "zwei" , "drei" , "vier" , "fünf" ])