ForwardTacotron NVDA下載 - ForwardTacotron NVDA源代碼下載

下載

NVDA屏幕讀取器的ForwardTacotron和HIFI-GAN支持

注意：此附加組件以及文檔仍在建設中。歡迎您的貢獻！

請記住，前向tacotron是Pytorch中的語音合成模型，它使用持續時間預測器來對齊文本和生成的MEL頻譜圖。該模型具有穩健性，速度，音高和能量操縱和效率等優點。

因此，此插件試圖通過客戶端/服務器在NVDA的開源屏幕讀取器中實現對forwardTacotron的支持，因為用作火炬的庫直接將其包含在NVDA中。

這是一項正在進行的工作，因此還有很多事情要做。

同時，您可以聆聽到目前為止取得的進展。

語言	嗓音	樣本
英語	LJSpeech（與Griffinlim Vocoder一起）
英語	LJSpeech（與Hifi-Gan Vocoder一起）
西班牙語	ALD數據集（帶有Hifi-Gan Vocoder）
西班牙語	ODAL（帶有Hifi-Gan Vocoder，通用模型）

一種將服務器整合到附加組件的方法。
- 發生這種情況時，請在加載合成器時允許服務器打開。服務器加載後，我們可以致電檢查以使語音合成器準備好使用。
- 可以為附加組件製作兩個版本，並在CPU支持和GPU支持下製作，因為顯然該合成是在GPU上實時生成的。同時，我們可能會注意到CPU的放緩。
合成環選項中的語音和能量變化支持。
目前，附加組件使用HTTPLIB2與服務器進行通信，但是我可以尋找其他方法，並在必要時重寫服務器的一部分。
添加支持加載可以在“ Voice_Models”文件夾中檢測到的不同聲音的支持。
- 這樣，可以添加用於下載訓練有素的模型的支持。我們有一個英語的LJSpeech模型，另一個是德語，兩個用西班牙語。
對於較新的多揚聲器模型，它可以讀取檢查設置以進行檢查，如果是這樣，它可以從Synth Ring Options中選擇語音，並首先諮詢模型上的揚聲器名稱。

展開

附加信息

相關應用

爲您推薦

相關資訊全部