Implementasi TTS dengan kombinasi Tacotron2 dan HiFi-Gan untuk Mandarin TTS.
Untuk inferensi, kita perlu mengunduh model Tacotraon2 pra-terlatih untuk Mandarin, dan menempatkan di jalur root. Kemudian, kita dapat menjalankan infer_tacotron2_hifigan.py untuk mendapatkan hasil TTS. Kita dapat mengubah teks input dengan mengedit text variabel di infer_tacotron2_hifigan.py . Maka hasilnya akan disimpan di jalur root yang dinamai output.wav .
Model HiFi-Gan yang sudah terlatih telah ditempatkan di LJ_FT_T2_V3 , yang dilatih oleh LJSppech dan disesuaikan dengan Tacotron2. Anda dapat menemukan lebih banyak model pra-terlatih dari repo HIFI-GAN asli dengan ukuran dan parameter yang berbeda. Jika Anda ingin mencoba berbagai model atau melatih model Anda sendiri, harap ingat untuk mengubah variabel di infer_tacotron2_hifigan.py untuk mengubah jalur model HiFi-Gan.
Input:相对论直接和间接的催生了量子力学的诞生也为研究微观世界的高速运动确立了全新的数学模型
Output: Tacotron2-hifigan.wav