ForwardTacotron NVDA
1.0.0
注意:此附加組件以及文檔仍在建設中。歡迎您的貢獻!
請記住,前向tacotron是Pytorch中的語音合成模型,它使用持續時間預測器來對齊文本和生成的MEL頻譜圖。該模型具有穩健性,速度,音高和能量操縱和效率等優點。
因此,此插件試圖通過客戶端/服務器在NVDA的開源屏幕讀取器中實現對forwardTacotron的支持,因為用作火炬的庫直接將其包含在NVDA中。
這是一項正在進行的工作,因此還有很多事情要做。
同時,您可以聆聽到目前為止取得的進展。
| 語言 | 嗓音 | 樣本 |
|---|---|---|
| 英語 | LJSpeech(與Griffinlim Vocoder一起) | |
| 英語 | LJSpeech(與Hifi-Gan Vocoder一起) | |
| 西班牙語 | ALD數據集(帶有Hifi-Gan Vocoder) | |
| 西班牙語 | ODAL(帶有Hifi-Gan Vocoder,通用模型) |