Expressive FastSpeech2
1.0.0
Non-autoregressive Expressive TTS :该项目旨在为未来的研究和应用提供基石,以对包括Emotional TTS和Conversational TTS在内的非自动回忆性表达性TT进行应用。对于数据集,AIHUB多模式视频AI数据集和IEmocap数据库分别用于韩语和英语。
注意:如果您对GST-TACOTRON或VAE-TACOTRON感兴趣,例如表达风格的TTS模型,但在非自动回调解码下,您也可能对Styler [Demo,Code]感兴趣。
Annotated Data Processing :该项目阐明了如何处理新数据集,即使使用不同的语言,以成功地培训非自动性情感TTS。
English and Korean TTS :除英语外,该项目还提供了对非自动回忆性TTS处理韩语的广泛看法,在该韩文中,必须在特定于语言的功能下考虑其他数据处理(例如,培训蒙特利尔强迫对准者与您自己的语言和数据集)。请仔细研究text/ 。
Adopting Own Language :对于那些有兴趣调整其他语言的人,请参阅分类分支的“使用您自己的数据集(自己的语言)培训”部分。
在这个项目中,FastSpeech2被改编为基本非自动回调的多演讲者TTS框架,因此先阅读纸张和代码会很有帮助(另请参见FastSpeSpeech2分支)。

Emotional TTS :以下分支包含由情绪端到端神经语音合成器实现的基本范式的实现。

Conversational TTS :以下分支包含语音代理的对话端到端TT的实现

如果您想使用或参考此实现,请引用回购。
@misc{lee2021expressive_fastspeech2,
author = {Lee, Keon},
title = {Expressive-FastSpeech2},
year = {2021},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = { u rl{https://github.com/keonlee9420/Expressive-FastSpeech2}}
}