Non-autoregressive Expressive TTS : этот проект направлен на то, чтобы обеспечить краеугольный камень для будущих исследований и применения неавторегрессивных выразительных TT, включая Emotional TTS и Conversational TTS . Для наборов данных, наборы данных MultiModal Video AIHUB и база данных IEMOCAP выбираются для корейского и английского языка соответственно.
Примечание . Если вы заинтересованы в GST-Tacotron или Vae-Tacotron, подобной выразительной стилистической модели TTS, но в неавторегрессивном декодировании вас также может быть заинтересован в Styler [Demo, Code].
Annotated Data Processing : этот проект проливает свет на то, как обрабатывать новый набор данных, даже с другим языком, для успешной подготовки неавторегрессивных эмоциональных TTS.
English and Korean TTS : в дополнение к английскому, этот проект дает широкое представление о том, чтобы относиться к корейскому языку для неавторегрессивных TTS, где дополнительная обработка данных должна рассматриваться в соответствии с особенностями языка (например, обучение Montreal вынуждено выравнивать с вашим собственным языком и набором данных). Пожалуйста, внимательно изучите text/ .
Adopting Own Language : для тех, кто заинтересован в адаптации других языков, пожалуйста, обратитесь к разделу «Обучение с вашим собственным набором данных (собственный язык)» категориальной филиала.
В этом проекте Fastspeech2 адаптирован как базовая неавторегрессивная структура Multi-Speaker TTS, поэтому было бы полезно сначала прочитать бумагу и код (также см. Fastspeech2 Branch).

Emotional TTS : Следующие ветви содержат реализации основной парадигмы, предпринимаемой эмоциональной сквозной нейронной речью.

Conversational TTS : Следующая ветвь содержит реализацию разговорных сквозных TTS для голосового агента

Если вы хотите использовать или обратиться к этой реализации, пожалуйста, укажите репо.
@misc{lee2021expressive_fastspeech2,
author = {Lee, Keon},
title = {Expressive-FastSpeech2},
year = {2021},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = { u rl{https://github.com/keonlee9420/Expressive-FastSpeech2}}
}