Non-autoregressive Expressive TTS : Dieses Projekt zielt darauf ab, einen Eckpfeiler für zukünftige Forschung und Anwendung auf nicht autoregressiven ausdrucksstarken TTs einschließlich Emotional TTS und Conversational TTS zu bieten. Für Datensätze werden AIHUB Multimodal Video AI -Datensätze und IEMOCAP -Datenbank für Koreanisch bzw. Englisch ausgewählt.
Hinweis : Wenn Sie sich für GST-Tacotron oder VAE-Tacotron wie das ausdrucksstarke Stylistik-TTS-Modell interessieren, jedoch unter nicht-autoregressiven Decodieren, können Sie auch an Styler [Demo, Code] interessiert sein.
Annotated Data Processing : Dieses Projekt beleuchtet, wie der neue Datensatz auch mit einer anderen Sprache für die erfolgreiche Schulung von nicht autoregressiven emotionalen TTs umgehen kann.
English and Korean TTS : Zusätzlich zu Englisch gibt dieses Projekt einen umfassenden Überblick über die Behandlung von Koreanisch für die nicht autoregressiven TTs, bei denen die zusätzliche Datenverarbeitung unter den sprachspezifischen Funktionen berücksichtigt werden muss (z. B. Training Montreal erzwungene Aligner mit Ihrer eigenen Sprache und Ihrem eigenen Datensatz). Bitte schauen Sie genau in text/ .
Adopting Own Language : Für diejenigen, die sich für die Anpassung anderer Sprachen interessieren, lesen Sie bitte den Abschnitt "Training mit Ihrem eigenen Datensatz (eigene Sprache)" des kategorialen Zweigs.
In diesem Projekt wird Fastspeech2 als nicht autoregressive TTS-Framework mit mehreren Lautsprechern angepasst. Daher wäre es hilfreich, das Papier und den Code zuerst zu lesen (siehe auch Fastspeech2-Zweig).

Emotional TTS : Die folgenden Zweige enthalten Implementierungen des grundlegenden Paradigmas, das von emotionalem End-to-End-Synthesizer für neuronale Sprachhöfe abgeschaltet wird.

Conversational TTS : Die folgende Zweigstelle enthält die Implementierung von TT-to-End-TTs von Konversation für Voice Agent

Wenn Sie diese Implementierung verwenden oder auf diese Implementierung verweisen möchten, zitieren Sie bitte das Repo.
@misc{lee2021expressive_fastspeech2,
author = {Lee, Keon},
title = {Expressive-FastSpeech2},
year = {2021},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = { u rl{https://github.com/keonlee9420/Expressive-FastSpeech2}}
}