很棒的tts樣本
用作者提供的帶有音頻樣本的TTS論文列表。每篇論文的最後一行顯示使用頻譜反轉(Vocoder)。
有關重要TTS論文的更全面列表,我建議閱讀Zhengxi Liu撰寫的XCMYZ/語音合成紙。
2020
- fastpitch- fastpitch:平行文本對語音和音調預測
- https://fastpitch.github.io/
- 浪潮
- 飲食 - 端到端對抗性文本到語音
- https://deepmind.com/research/publications/end-to-to-end-end-versarial-text-text-spech
- 端到端模型
- Glow-tts-Glow-TTS:通過單調對準搜索進行文本到語音的生成流程
- https://jaywalnut310.github.io/glow-tts-demo
- 浪潮
- Flowtron-流動條:用於文本到語音綜合的基於自回歸流量的生成網絡
- https://nv-adlr.github.io/flowtron
- 浪潮
2019
- TACOTRON2+DCA-可靠的長形語音合成的位置相關注意機制
- https://google.github.io/tacotron/publications/location_relative_atterention
- Wavernn
- gan -tts-具有對抗網絡的高保真語音綜合
- https://storage.googleapis.com/deepmind-media/research/abstract.wav
- 端到端型號(建立在200Hz語言和日誌音調功能之上)
- 多語言tacotron2-學習用外語說流利:多語言語音綜合和跨語言語音克隆
- https://google.github.io/tacotron/publications/multingual
- Wavernn
- Melnet -Melnet:頻域中音頻的生成模型
- https://audio-samples.github.io
- https://sjvasquez.github.io/blog/melnet
- 基於梯度的頻譜圖反演
- FastSpeech-快速播音:快速,強大而可控的文本到語音
- https://speechresearch.github.io/fastspeech
- 浪潮
- Paranet-平行神經文本到語音
- https://parallel-neural-tts-demo.github.io
- 波浪,單簧管,波納特
2018
- 變壓器-TTS-具有變壓器網絡的神經語音綜合
- https://neuraltts.github.io/transformertts
- vavenet
- 多演講者tacotron2-從揚聲器驗證到多言式語音到語音綜合的轉移學習
- https://google.github.io/tacotron/publications/speaker_adaptation
- vavenet
- tacotron2+GST-樣式令牌:無監督的樣式建模,控制和轉移端到端語音合成
- https://google.github.io/tacotron/publications/global_style_tokens
- 格里芬·萊姆(Griffin-Lim)
2017
- TACOTRON2-通過調節象徵在MEL頻譜圖預測上通過調節象球來合成天然TTS
- https://google.github.io/tacotron/publications/tacotron2
- vavenet
- TACOTRON-TACOTRON:朝向端到端語音合成
- https://google.github.io/tacotron/publications/tacotron
- 格里芬·萊姆(Griffin-Lim)
貢獻
托多