ForwardTacotron NVDA下载 - ForwardTacotron NVDA源代码下载

下载

NVDA屏幕读取器的ForwardTacotron和HIFI-GAN支持

注意：此附加组件以及文档仍在建设中。欢迎您的贡献！

请记住，前向tacotron是Pytorch中的语音合成模型，它使用持续时间预测器来对齐文本和生成的MEL频谱图。该模型具有稳健性，速度，音高和能量操纵和效率等优点。

因此，此插件试图通过客户端/服务器在NVDA的开源屏幕读取器中实现对forwardTacotron的支持，因为用作火炬的库直接将其包含在NVDA中。

这是一项正在进行的工作，因此还有很多事情要做。

同时，您可以聆听到目前为止取得的进展。

语言	嗓音	样本
英语	LJSpeech（与Griffinlim Vocoder一起）
英语	LJSpeech（与Hifi-Gan Vocoder一起）
西班牙语	ALD数据集（带有Hifi-Gan Vocoder）
西班牙语	ODAL（带有Hifi-Gan Vocoder，通用模型）

一种将服务器整合到附加组件的方法。
- 发生这种情况时，请在加载合成器时允许服务器打开。服务器加载后，我们可以致电检查以使语音合成器准备好使用。
- 可以为附加组件制作两个版本，并在CPU支持和GPU支持下制作，因为显然该合成是在GPU上实时生成的。同时，我们可能会注意到CPU的放缓。
合成环选项中的语音和能量变化支持。
目前，附加组件使用HTTPLIB2与服务器进行通信，但是我可以寻找其他方法，并在必要时重写服务器的一部分。
添加支持加载可以在“ Voice_Models”文件夹中检测到的不同声音的支持。
- 这样，可以添加用于下载训练有素的模型的支持。我们有一个英语的LJSpeech模型，另一个是德语，两个用西班牙语。
对于较新的多扬声器模型，它可以读取检查设置以进行检查，如果是这样，它可以从Synth Ring Options中选择语音，并首先咨询模型上的扬声器名称。

展开

附加信息