ForwardTacotron NVDA
1.0.0
注意:此附加组件以及文档仍在建设中。欢迎您的贡献!
请记住,前向tacotron是Pytorch中的语音合成模型,它使用持续时间预测器来对齐文本和生成的MEL频谱图。该模型具有稳健性,速度,音高和能量操纵和效率等优点。
因此,此插件试图通过客户端/服务器在NVDA的开源屏幕读取器中实现对forwardTacotron的支持,因为用作火炬的库直接将其包含在NVDA中。
这是一项正在进行的工作,因此还有很多事情要做。
同时,您可以聆听到目前为止取得的进展。
| 语言 | 嗓音 | 样本 |
|---|---|---|
| 英语 | LJSpeech(与Griffinlim Vocoder一起) | |
| 英语 | LJSpeech(与Hifi-Gan Vocoder一起) | |
| 西班牙语 | ALD数据集(带有Hifi-Gan Vocoder) | |
| 西班牙语 | ODAL(带有Hifi-Gan Vocoder,通用模型) |