RVG_tts
v1.3.0
基於檢索的語音生成文本對語音系統是基於Python的語音文本,依賴於兩個核心部分。為了能夠產生語音,它依賴於Tacotron將文本轉換為語音,然後使用RVC語音轉換來使其聽起來像任何字符,而無需使用音頻文件。
該TTS已在Python 3.10上進行了測試,儘管可以在其他版本上使用。
您必須使用最新的64位ESPEAK NG版本。
為了構建FairSeq依賴關係,您必須擁有Visual Studio並安裝“使用C ++”開發軟件包安裝“桌面開發”。
要使用它,請安裝詩歌並使用poetry install --no-root ,然後下載Hubert Model,Forward Tacotron模型和任何RVC模型。然後,您可以將它們放入具有相應名稱的模型文件夾中:
hubert_base.pt > hubert.ptforward_steps90k.pt > forward.pt(rvc .pth model name) - > rvc_model.pth(rvc .index model name) - > rvc_index.index (可選)一旦擁有所有這些,就可以在CLI上使用所需的參數運行RVG.py文件,在沒有任何參數的情況下運行該文件以啟動Gradio WebUI,也可以將此代碼包含在您自己的項目中,並從RVG.py導入rvg_tts函數。
為了使用不同的語言,必須訓練新的前向TACOTRON模型。沒有數據集,這是我無法做的。這是我向社區尋求幫助的地方。如果您可以提供數據集,請這樣做。
前進TACOTRON已獲得MIT許可證的許可
RVC WebUI已獲得MIT許可證的許可
版權2023 FOXIFY52
根據Apache許可證(版本2.0(“許可”)獲得許可;除了符合許可外,您不得使用此文件。您可以在
http://www.apache.org/licenses/LICENSE-2.0
除非適用法律要求或以書面形式同意,否則根據許可證分配的軟件是按照“原樣”分發的,沒有任何明示或暗示的保證或條件。請參閱許可證,以獲取執行許可條款和限制的特定語言。