tts german pytorch
1.0.0
Fastpitch(Arxiv)接受了ThorstenMüller的Thorsten – 2022.10和Thorsten-21.06-Entional Dataset訓練。

您可以在這裡收聽一些音頻樣本。
必需的包裝: torch torchaudio pyyaml phonemizer
請參閱此處以安裝phonemizer和espeak-ng後端。
〜用於培訓: librosa matplotlib tensorboard
〜對於演示應用程序: fastapi "uvicorn[standard]"
下載FastPitch型號鏈接的預算權重。
下載Hifi-Gan Vocoder重量(鏈接)。將它們放入pretrained/hifigan-thor-v1中,或在configs/basic.yaml中編輯以下行。
# vocoder
vocoder_state_path : pretrained/hifigan-thor-v1/hifigan-thor.pth
vocoder_config_path : pretrained/hifigan-thor-v1/config.json models.fastpitch的FastPitch是一個包裝器,簡化了文本與摩爾的推理。 FastPitch2Wave模型包括用於直接文本到語音推斷的Hifi-Gan Vocoder。
from models . fastpitch import FastPitch
model = FastPitch ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
mel_spec = model . ttmel ( "Hallo Welt!" ) from models . fastpitch import FastPitch2Wave
model = FastPitch2Wave ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
wave = model . tts ( "Hallo Welt!" )
wave_list = model . tts ([ "null" , "eins" , "zwei" , "drei" , "vier" , "fünf" ])Web應用程序使用FastAPI庫。要運行該應用程序,您需要以下軟件包:
FastApi:對於後端API | UVICORN:為應用程序服務
使用: pip install fastapi "uvicorn[standard]"
運行: python app.py
預覽:

感謝ThorstenMüller的高質量數據集。
FastPitch文件源於Nvidia的深度學習示例