text_generation_webui_xtts
1.0.0
这是文本生成 - webui的简单扩展名,可实现多种语言tts,并使用coqui-ai/tts的XTTTSV2语音克隆。
XTTSV2现在内置在文本生成 - webui(coqui_tts)中。我可能仍会为叙述者功能更新此扩展名,但是如果您不在乎,请使用官方扩展名。
这是我根据Barktts扩展而迅速将其扔在一起的非常粗糙的扩展。它可能起作用也可能不起作用。随意改进代码并提交公关。
通过运行cmd_windows.bat / cmd_linux.sh / cmd_macos.sh / cmd_wsl.bat来激活环境,根据您的平台,或者在手动安装Conda环境中。克隆这个仓库:
cd extensions
git clone https://github.com/kanttouchthis/text_generation_webui_xtts
安装TTS的依赖项。
cd text_generation_webui_xtts
pip install -r requirements.txt
安装TTS。他们的版本要求引起问题,因此我们在没有版本要求的情况下安装了上述依赖项。
pip install TTS --no-dependencies
完成上面的步骤后,您可以在Voices文件夹中添加一些声音。这可以是某人说话的任何简短(3-6秒)的WAV剪辑。确保它是高质量的音频,没有较长的空白。然后,使用--extensions text_generation_webui_xtts运行WebUI,然后在底部选择您的语音/语言以及其他设置。首次运行时,您可能必须通过控制台接受条款和条件。