xtts webui下载xtts webui源代码下载

xtts webui

Ai源码

Deepspeed wheels for Windows

下载

XTTS-WEBUI

便携式版本

该项目现在具有便携式版本，因此您不必遇到安装所有依赖项的麻烦。

点击此处下载

除了Windows和具有6 GB视频内存的NVIDIA图形卡外，您什么都不需要。

火车选项卡被打破，如果您想训练模型，请使用单独的webui

XTTS-FINETUNE-WEBUI

以下语言可用读数

英语

俄语

葡萄牙

关于项目

XTTS-WEBUI是一个Web界面，可让您充分利用XTT。该界面周围还有其他神经网络可以改善您的结果。您还可以微调模型并获得高质量的语音模型。

关键功能

轻松使用XTTSV2
配音大量文件的批处理处理
能够通过语音节省来翻译任何音频
使用神经网络和音频工具自动改善结果的能力
能够微调模型并立即使用
能够使用以下工具，例如： RVC ， OpenVoice ，类似于增强的工具
能够自定义XTTS生成，所有参数，多个说话样本

托多

添加带有进度和错误信息的状态栏
将培训集成到标准界面
添加流式传输的能力以检查结果
添加一种处理文本的新方法
添加批处理处理时自定义扬声器的功能
添加API

安装

通过Google Colab使用此Web UI

请确保您拥有Python 3.10.x或Python 3.11，CUDA 11.8或CUDA 12.1，Microsoft Builder Tools 2019带有C ++软件包，并安装了FFMPEG

1方法，通过脚本

视窗

开始：

运行“ install.bat”文件
要启动Web UI，请运行'start_xtts_webui.bat'
打开您喜欢的浏览器，然后转到控制台显示的本地地址。

Linux

开始：

运行“ install.sh”文件
要启动Web UI，请运行'start_xtts_webui.sh'
打开您喜欢的浏览器，然后转到控制台显示的本地地址。

2方法，手册

请按照以下步骤进行安装：

确保安装CUDA
克隆存储库： git clone https://github.com/daswer123/xtts-webui
导航到目录： cd xtts-webui
创建虚拟环境： python -m venv venv
激活虚拟环境：
- 在Windows上使用： venvscriptsactivate
- 在Linux上使用： source venvbinactivate
使用PIP命令安装Pytorch和Torchaudio：
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
从unignts.txt安装所有依赖项：
pip install -r requirements.txt

运行应用程序

要启动界面，请按照以下步骤：

启动XTTS webui：

激活您的虚拟环境：

venv/scripts/activate

或者，如果您在Linux上

 source venv/bin/activate

然后通过运行此命令来启动XTT的WebUI：

python app.py

以下是一些运行时参数，可以在启动应用程序时使用：

争论	默认值	描述
-HS， - 主持人	127.0.0.1	主机约束
-p， - 港口	8010	要收听的端口号
-d， - 设备	库达	要使用哪种设备（CPU或CUDA）
-sf， - spearder_folder	演讲者/	包含TTS样品的目录
-o， - 输出	“输出/”	输出目录
-l， - 语言	“汽车”	WebUI语言，您可以在I18N/LOCALE文件夹中看到可用的翻译。
-ms， - 模型源	“当地的”	定义模型源：用于使用本地推理和模型v2.0.2的存储库中的最新版本的“ API”。
-v，-version	“ v2.0.2”	您可以指定要使用的XTT版本。您可以为此目的指定自定义模型的名称
- Lowvram		启用低VRAM模式，该模式在不积极处理时将模型切换为RAM
- 深度		启用深速加速。在Python 3.10和3.11上的Windows上作品
- 分享		允许在本地计算机外共享接口
-rvc		启用RVC后处理，所有型号均应在RVC文件夹中定位

TTS-> RVC

RVC的模块，您可以启用RVC模块以后处理收到的音频，如果您在控制台中运行或将其写入启动文件，则需要添加-RVC标志

为了使模型在RVC设置中工作，您需要选择一个必须首先上传到Voice2Voice/RVC文件夹的模型，模型和索引文件必须在一起，索引文件是可选的，每个模型必须在单独的文件夹中。

XTTS-WEBUI和官方WebUI之间的差异

数据处理

更快地更新到0.10.0，并能够选择较大的V3模型。
将输出文件夹更改为主文件夹内的输出文件夹。
如果输出文件夹中已经有一个数据集，并且您想添加新数据，则可以通过简单地添加新音频来完成，即不会再次处理内容，并且将自动添加新数据
打开VAD过滤器
创建数据集后，创建一个文件，以指定数据集的语言。该文件在培训之前已读取，以使该语言始终匹配。重新启动界面时很方便

微调XTTS编码器

添加了选择XTT的基本模型的功能，以及您重新训练时不需要再次下载模型。
在培训期间选择自定义模型作为基本模型的增加能力，这将允许芬太尼已经为芬太尼模型。
添加的可能性以获得1个单击的模型的优化版本（步骤2.5，将优化版本放入输出文件夹中）。
您可以在优化模型后选择是否删除培训文件夹
当您优化模型时，示例参考音频将移至输出文件夹
检查指定语言和数据集语言的正确性

推理

增加了在模型检查过程中自定义推论设置的可能性。

其他

如果您在其中一个步骤中意外重新启动界面，则可以将数据加载到其他按钮中
删除日志的显示，因为它在重新启动时会引起问题
完成的结果已复制到Ready文件夹，这些文件已完全完成，您可以将它们移动到任何地方，并将其用作标准模型
在这里增加了对日语的支持

展开

附加信息

版本 Deepspeed wheels for Windows
类型 Ai源码
更新时间 2025-09-14
大小 1.83MB
来自于 Github

xtts webui

XTTS-WEBUI

便携式版本

火车选项卡被打破，如果您想训练模型，请使用单独的webui

XTTS-FINETUNE-WEBUI

以下语言可用读数

关于项目

关键功能

托多

安装

1方法，通过脚本

视窗

Linux

2方法，手册

运行应用程序

启动XTTS webui：

TTS-> RVC

XTTS-WEBUI和官方WebUI之间的差异

数据处理

微调XTTS编码器

推理

其他

webui_bfm

JableTVDownload WebUI

flux webui

open webui

webui

stable diffusion webui

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express