Mise en œuvre de TTS avec combinaison de Tacotron2 et Hifi-Gan pour le mandarin TTS.
Afin de l'inférence, nous devons télécharger le modèle Tacotraon2 pré-formé pour le mandarin et placer dans le chemin racine. Ensuite, nous pouvons exécuter infer_tacotron2_hifigan.py pour obtenir le résultat TTS. Nous pouvons modifier le texte d'entrée en modifiant text de la variable dans l' infer_tacotron2_hifigan.py . Ensuite, le résultat sera enregistré dans le chemin racine nommé sous output.wav .
Le modèle pré-formé de HiFI-Gan a été placé dans le LJ_FT_T2_V3 , qui est formé par LJSppech et affiné avec Tacotron2. Vous pouvez trouver plus de modèle pré-formé à partir du dépôt HIFI-GAN original avec des tailles et des paramètres différents. Si vous souhaitez essayer différents modèles ou former votre propre modèle, n'oubliez pas de modifier les variables dans infer_tacotron2_hifigan.py pour changer le chemin du modèle Hifi-Agan.
Entrée:相对论直接和间接的催生了量子力学的诞生也为研究微观世界的高速运动确立了全新的数学模型
Sortie: tacotron2-hifigan.wav