该项目现在具有便携式版本,因此您不必遇到安装所有依赖项的麻烦。
点击此处下载
除了Windows和具有6 GB视频内存的NVIDIA图形卡外,您什么都不需要。
英语
俄语
葡萄牙
XTTS-WEBUI是一个Web界面,可让您充分利用XTT。该界面周围还有其他神经网络可以改善您的结果。您还可以微调模型并获得高质量的语音模型。

通过Google Colab使用此Web UI
请确保您拥有Python 3.10.x或Python 3.11,CUDA 11.8或CUDA 12.1,Microsoft Builder Tools 2019带有C ++软件包,并安装了FFMPEG
开始:
开始:
请按照以下步骤进行安装:
确保安装CUDA
克隆存储库: git clone https://github.com/daswer123/xtts-webui
导航到目录: cd xtts-webui
创建虚拟环境: python -m venv venv
激活虚拟环境:
venvscriptsactivatesource venvbinactivate使用PIP命令安装Pytorch和Torchaudio:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
从unignts.txt安装所有依赖项:
pip install -r requirements.txt
要启动界面,请按照以下步骤:
激活您的虚拟环境:
venv/scripts/activate或者,如果您在Linux上
source venv/bin/activate然后通过运行此命令来启动XTT的WebUI:
python app.py以下是一些运行时参数,可以在启动应用程序时使用:
| 争论 | 默认值 | 描述 |
|---|---|---|
| -HS, - 主持人 | 127.0.0.1 | 主机约束 |
| -p, - 港口 | 8010 | 要收听的端口号 |
| -d, - 设备 | 库达 | 要使用哪种设备(CPU或CUDA) |
| -sf, - spearder_folder | 演讲者/ | 包含TTS样品的目录 |
| -o, - 输出 | “输出/” | 输出目录 |
| -l, - 语言 | “汽车” | WebUI语言,您可以在I18N/LOCALE文件夹中看到可用的翻译。 |
| -ms, - 模型源 | “当地的” | 定义模型源:用于使用本地推理和模型v2.0.2的存储库中的最新版本的“ API”。 |
| -v,-version | “ v2.0.2” | 您可以指定要使用的XTT版本。您可以为此目的指定自定义模型的名称 |
| - Lowvram | 启用低VRAM模式,该模式在不积极处理时将模型切换为RAM | |
| - 深度 | 启用深速加速。在Python 3.10和3.11上的Windows上作品 | |
| - 分享 | 允许在本地计算机外共享接口 | |
| -rvc | 启用RVC后处理,所有型号均应在RVC文件夹中定位 |
RVC的模块,您可以启用RVC模块以后处理收到的音频,如果您在控制台中运行或将其写入启动文件,则需要添加-RVC标志
为了使模型在RVC设置中工作,您需要选择一个必须首先上传到Voice2Voice/RVC文件夹的模型,模型和索引文件必须在一起,索引文件是可选的,每个模型必须在单独的文件夹中。