Non-autoregressive Expressive TTS : Ce projet vise à fournir une pierre angulaire pour les recherches et l'application futures sur une TTS expressive non autorégressive, y compris Emotional TTS et Conversational TTS . Pour les ensembles de données, les ensembles de données AIHUB Multimodal Video AI et la base de données IEMOCAP sont choisis pour coréen et anglais, respectivement.
Remarque : Si vous êtes intéressé par le modèle TTS stylistique expressif, mais sous décodage non autorégressif, vous pouvez également être intéressé par Styler [Demo, Code].
Annotated Data Processing : ce projet a mis en lumière la façon de gérer le nouvel ensemble de données, même avec une langue différente, pour la formation réussie des TT émotionnels non autorégressifs.
English and Korean TTS : En plus de l'anglais, ce projet donne une vue large du traitement de Corée pour les TT non autorégressifs où le traitement supplémentaire des données doit être pris en compte dans les caractéristiques spécifiques à la langue (par exemple, la formation de Montréal a forcé un aligneur avec votre propre langue et votre ensemble de données). Veuillez examiner de près text/ .
Adopting Own Language : pour ceux qui souhaitent adapter d'autres langues, veuillez vous référer à la section "Formation avec votre propre ensemble de données (propre langue)" de la branche catégorique.
Dans ce projet, FastSpeech2 est adapté en tant que cadre TTS multi-partenseur non autorégressif de base, il serait donc utile de lire d'abord le papier et le code (voir également la branche FastSpeech2).

Emotional TTS : les branches suivantes contiennent des implémentations du paradigme de base pardigées par le synthétiseur de la parole neuronale émotionnelle de bout en bout.

Conversational TTS : la branche suivante contient la mise en œuvre de TTS de bout en bout conversationnels pour l'agent vocal

Si vous souhaitez utiliser ou vous référer à cette implémentation, veuillez citer le dépôt.
@misc{lee2021expressive_fastspeech2,
author = {Lee, Keon},
title = {Expressive-FastSpeech2},
year = {2021},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = { u rl{https://github.com/keonlee9420/Expressive-FastSpeech2}}
}