text_generation_webui_xtts
1.0.0
這是文本生成 - webui的簡單擴展名,可實現多種語言tts,並使用coqui-ai/tts的XTTTSV2語音克隆。
XTTSV2現在內置在文本生成 - webui(coqui_tts)中。我可能仍會為敘述者功能更新此擴展名,但是如果您不在乎,請使用官方擴展名。
這是我根據Barktts擴展而迅速將其扔在一起的非常粗糙的擴展。它可能起作用也可能不起作用。隨意改進代碼並提交公關。
通過運行cmd_windows.bat / cmd_linux.sh / cmd_macos.sh / cmd_wsl.bat來激活環境,根據您的平台,或者在手動安裝Conda環境中。克隆這個倉庫:
cd extensions
git clone https://github.com/kanttouchthis/text_generation_webui_xtts
安裝TTS的依賴項。
cd text_generation_webui_xtts
pip install -r requirements.txt
安裝TTS。他們的版本要求引起問題,因此我們在沒有版本要求的情況下安裝了上述依賴項。
pip install TTS --no-dependencies
完成上面的步驟後,您可以在Voices文件夾中添加一些聲音。這可以是某人說話的任何簡短(3-6秒)的WAV剪輯。確保它是高質量的音頻,沒有較長的空白。然後,使用--extensions text_generation_webui_xtts運行WebUI,然後在底部選擇您的語音/語言以及其他設置。首次運行時,您可能必須通過控制台接受條款和條件。