Fastpitch (ARXIV) dilatih di Thorsten Müller dari Thorsten-2022.10 dan Dataset Thorsten-21.06-Emotional.

Anda dapat mendengarkan beberapa sampel audio di sini.
Paket yang Diperlukan: torch torchaudio pyyaml phonemizer
Silakan merujuk di sini untuk menginstal phonemizer dan backend espeak-ng .
~ untuk pelatihan: librosa matplotlib tensorboard
~ Untuk aplikasi demo: fastapi "uvicorn[standard]"
Unduh bobot pretrained untuk tautan model fastpitch.
Unduh Bobot Vocoder Hifi-Gan (tautan). Entah memasukkannya ke dalam pretrained/hifigan-thor-v1 atau mengedit baris berikut di configs/basic.yaml .
# vocoder
vocoder_state_path : pretrained/hifigan-thor-v1/hifigan-thor.pth
vocoder_config_path : pretrained/hifigan-thor-v1/config.json FastPitch dari models.fastpitch FastPitch adalah pembungkus yang menyederhanakan inferensi teks-ke-mel. Model FastPitch2Wave mencakup vocoder HiFi-gan untuk inferensi teks-ke-speech langsung.
from models . fastpitch import FastPitch
model = FastPitch ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
mel_spec = model . ttmel ( "Hallo Welt!" ) from models . fastpitch import FastPitch2Wave
model = FastPitch2Wave ( 'pretrained/fastpitch_de.pth' )
model = model . cuda ()
wave = model . tts ( "Hallo Welt!" )
wave_list = model . tts ([ "null" , "eins" , "zwei" , "drei" , "vier" , "fünf" ])Aplikasi Web menggunakan pustaka FASTAPI. Untuk menjalankan aplikasi, Anda membutuhkan paket berikut:
Fastapi: untuk API backend | Uvicorn: untuk melayani aplikasi
Instal dengan: pip install fastapi "uvicorn[standard]"
Jalankan dengan: python app.py
Pratinjau:

Terima kasih kepada Thorsten Müller untuk set data berkualitas tinggi.
File FastPitch berasal dari contoh deeplearning -campo NVIDIA