很棒的tts样本
用作者提供的带有音频样本的TTS论文列表。每篇论文的最后一行显示使用频谱反转(Vocoder)。
有关重要TTS论文的更全面列表,我建议阅读Zhengxi Liu撰写的XCMYZ/语音合成纸。
2020
- fastpitch- fastpitch:平行文本对语音和音调预测
- https://fastpitch.github.io/
- 浪潮
- 饮食 - 端到端对抗性文本到语音
- https://deepmind.com/research/publications/end-to-to-end-end-versarial-text-text-spech
- 端到端模型
- Glow-tts-Glow-TTS:通过单调对准搜索进行文本到语音的生成流程
- https://jaywalnut310.github.io/glow-tts-demo
- 浪潮
- Flowtron-流动条:用于文本到语音综合的基于自回归流量的生成网络
- https://nv-adlr.github.io/flowtron
- 浪潮
2019
- TACOTRON2+DCA-可靠的长形语音合成的位置相关注意机制
- https://google.github.io/tacotron/publications/location_relative_atterention
- Wavernn
- gan -tts-具有对抗网络的高保真语音综合
- https://storage.googleapis.com/deepmind-media/research/abstract.wav
- 端到端型号(建立在200Hz语言和日志音调功能之上)
- 多语言tacotron2-学习用外语说流利:多语言语音综合和跨语言语音克隆
- https://google.github.io/tacotron/publications/multingual
- Wavernn
- Melnet -Melnet:频域中音频的生成模型
- https://audio-samples.github.io
- https://sjvasquez.github.io/blog/melnet
- 基于梯度的频谱图反演
- FastSpeech-快速播音:快速,强大而可控的文本到语音
- https://speechresearch.github.io/fastspeech
- 浪潮
- Paranet-平行神经文本到语音
- https://parallel-neural-tts-demo.github.io
- 波浪,单簧管,波纳特
2018
- 变压器-TTS-具有变压器网络的神经语音综合
- https://neuraltts.github.io/transformertts
- vavenet
- 多演讲者tacotron2-从扬声器验证到多言式语音到语音综合的转移学习
- https://google.github.io/tacotron/publications/speaker_adaptation
- vavenet
- tacotron2+GST-样式令牌:无监督的样式建模,控制和转移端到端语音合成
- https://google.github.io/tacotron/publications/global_style_tokens
- 格里芬·莱姆(Griffin-Lim)
2017
- TACOTRON2-通过调节象征在MEL频谱图预测上通过调节象球来合成天然TTS
- https://google.github.io/tacotron/publications/tacotron2
- vavenet
- TACOTRON-TACOTRON:朝向端到端语音合成
- https://google.github.io/tacotron/publications/tacotron
- 格里芬·莱姆(Griffin-Lim)
贡献
托多