RVG_tts
v1.3.0
基于检索的语音生成文本对语音系统是基于Python的语音文本,依赖于两个核心部分。为了能够产生语音,它依赖于Tacotron将文本转换为语音,然后使用RVC语音转换来使其听起来像任何字符,而无需使用音频文件。
该TTS已在Python 3.10上进行了测试,尽管可以在其他版本上使用。
您必须使用最新的64位ESPEAK NG版本。
为了构建FairSeq依赖关系,您必须拥有Visual Studio并安装“使用C ++”开发软件包安装“桌面开发”。
要使用它,请安装诗歌并使用poetry install --no-root ,然后下载Hubert Model,Forward Tacotron模型和任何RVC模型。然后,您可以将它们放入具有相应名称的模型文件夹中:
hubert_base.pt > hubert.ptforward_steps90k.pt > forward.pt(rvc .pth model name) - > rvc_model.pth(rvc .index model name) - > rvc_index.index (可选)一旦拥有所有这些,就可以在CLI上使用所需的参数运行RVG.py文件,在没有任何参数的情况下运行该文件以启动Gradio WebUI,也可以将此代码包含在您自己的项目中,并从RVG.py导入rvg_tts函数。
为了使用不同的语言,必须训练新的前向TACOTRON模型。没有数据集,这是我无法做的。这是我向社区寻求帮助的地方。如果您可以提供数据集,请这样做。
前进TACOTRON已获得MIT许可证的许可
RVC WebUI已获得MIT许可证的许可
版权2023 FOXIFY52
根据Apache许可证(版本2.0(“许可”)获得许可;除了符合许可外,您不得使用此文件。您可以在
http://www.apache.org/licenses/LICENSE-2.0
除非适用法律要求或以书面形式同意,否则根据许可证分配的软件是按照“原样”分发的,没有任何明示或暗示的保证或条件。请参阅许可证,以获取执行许可条款和限制的特定语言。