daisy tts
1.0.0
Rendi Chevi , Alham Fikri Aji
mbzuai
?纸链接| ?项目页面| ?代码即将推出!
我们经常以多方面的方式在口头上表达情感,它们的强度可能会有所不同,并且不仅可以表达为单一的表达,而且可以作为情感的混合。在情感的结构模型中,这种广泛的情感已经很好地研究了,它代表了各种情感的多种情感,其强度程度不同。在本文中,我们提出了一种情感文本到语音设计,以模拟基于结构模型的更广泛的情感。我们提出的设计Daisy-TTS结合了一个韵律编码器,以学习嵌入情感的韵律作为情感的代理。这种情感表示可以模拟模型:(1)从训练样本中学到的主要情绪,(2)次要情绪,作为主要情感的混合,(3)强度级别,通过缩放情绪嵌入,以及(4)情绪极性,通过消除情绪嵌入。通过一系列的感知评估,与基线相比,雏菊-TT表现出了总体上更高的情感语音和情感感知力。