daisy tts
1.0.0
Rendi Chevi , Alham Fikri Aji
mbzuai
?紙鏈接| ?項目頁面| ?代碼即將推出!
我們經常以多方面的方式在口頭上表達情感,它們的強度可能會有所不同,並且不僅可以表達為單一的表達,而且可以作為情感的混合。在情感的結構模型中,這種廣泛的情感已經很好地研究了,它代表了各種情感的多種情感,其強度程度不同。在本文中,我們提出了一種情感文本到語音設計,以模擬基於結構模型的更廣泛的情感。我們提出的設計Daisy-TTS結合了一個韻律編碼器,以學習嵌入情感的韻律作為情感的代理。這種情感表示可以模擬模型:(1)從訓練樣本中學到的主要情緒,(2)次要情緒,作為主要情感的混合,(3)強度級別,通過縮放情緒嵌入,以及(4)情緒極性,通過消除情緒嵌入。通過一系列的感知評估,與基線相比,雛菊-TT表現出了總體上更高的情感語音和情感感知力。