tts german pytorch
1.0.0
Fastpitch(Arxiv)接受了ThorstenMüller的Thorsten – 2022.10和Thorsten-21.06-Entional Dataset训练。

您可以在这里收听一些音频样本。
必需的包装: torch torchaudio pyyaml phonemizer
请参阅此处以安装phonemizer和espeak-ng后端。
〜用于培训: librosa matplotlib tensorboard
〜对于演示应用程序: fastapi "uvicorn[standard]"
下载FastPitch型号链接的预算权重。
下载Hifi-Gan Vocoder重量(链接)。将它们放入pretrained/hifigan-thor-v1中,或在configs/basic.yaml中编辑以下行。
# vocoder
vocoder_state_path : pretrained/hifigan-thor-v1/hifigan-thor.pth
vocoder_config_path : pretrained/hifigan-thor-v1/config.json models.fastpitch的FastPitch是一个包装器,简化了文本与摩尔的推理。 FastPitch2Wave模型包括用于直接文本到语音推断的Hifi-Gan Vocoder。
from models . fastpitch import FastPitch
model = FastPitch ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
mel_spec = model . ttmel ( "Hallo Welt!" ) from models . fastpitch import FastPitch2Wave
model = FastPitch2Wave ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
wave = model . tts ( "Hallo Welt!" )
wave_list = model . tts ([ "null" , "eins" , "zwei" , "drei" , "vier" , "fünf" ])Web应用程序使用FastAPI库。要运行该应用程序,您需要以下软件包:
FastApi:对于后端API | UVICORN:为应用程序服务
使用: pip install fastapi "uvicorn[standard]"
运行: python app.py
预览:

感谢ThorstenMüller的高质量数据集。
FastPitch文件源于Nvidia的深度学习示例