Non-autoregressive Expressive TTS : este proyecto tiene como objetivo proporcionar una piedra angular para futuras investigaciones y aplicaciones sobre un TTS expresivo no autorgresivo que incluye Emotional TTS y Conversational TTS . Para conjuntos de datos, los conjuntos de datos de AI multimodal AIHUB y la base de datos IEMOCAP se eligen para coreano e inglés, respectivamente.
Nota : Si está interesado en GST-Tacotron o Vae-Tacotron como el modelo TTS estilístico expresivo, pero bajo una decodificación no autorgresiva, también puede estar interesado en Styler [demo, código].
Annotated Data Processing : este proyecto arroja luz sobre cómo manejar el nuevo conjunto de datos, incluso con un lenguaje diferente, para la capacitación exitosa de los TT emocionales no autorgresivos.
English and Korean TTS : además del inglés, este proyecto ofrece una visión amplia del tratamiento coreano para los TT no autorregeses, donde el procesamiento de datos adicional debe considerarse bajo las características específicas del idioma (por ejemplo, capacitar al alineador forzado de Montreal con su propio idioma y conjunto de datos). Por favor, busque de cerca text/ .
Adopting Own Language : para aquellos que estén interesados en adaptar otros idiomas, consulte la sección "Capacitación con su propio conjunto de datos (lenguaje propio)" de la rama categórica.
En este proyecto, FastSpeech2 se adapta como un marco TTS de múltiples altavoces no autorregresivo, por lo que sería útil leer primero el documento y el código (ver también la rama FastSpeech2).

Emotional TTS : las siguientes ramas contienen implementaciones del paradigma básico intordido por el sintetizador emocional de habla neural de extremo a extremo.

Conversational TTS : la siguiente rama contiene la implementación de TTS de extremo a extremo conversacional para agente de voz

Si desea usar o consultar esta implementación, cite el repositorio.
@misc{lee2021expressive_fastspeech2,
author = {Lee, Keon},
title = {Expressive-FastSpeech2},
year = {2021},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = { u rl{https://github.com/keonlee9420/Expressive-FastSpeech2}}
}