xtts webui download - xtts webui código fonte download

xtts webui

Código-Fonte de IA

Deepspeed wheels for Windows

Baixar

XTTS-Webui

Versão portátil

O projeto agora possui uma versão portátil, para que você não precise ter o trabalho de instalar todas as dependências.

Clique aqui para baixar

Você não precisa de nada além do Windows e uma placa gráfica da NVIDIA com 6 GB de memória de vídeo para executá -la.

A guia do trem está quebrada, se você deseja treinar um modelo, use um webui separado

XTTS-FineTune-Webui

ReadMe está disponível nos seguintes idiomas

Inglês

russo

Português

Sobre o projeto

XTTS-Webui é uma interface da web que permite aproveitar ao máximo o XTTS. Existem outras redes neurais em torno dessa interface que melhorarão seus resultados. Você também pode ajustar o modelo e obter um modelo de voz de alta qualidade.

imagem

Principais recursos

Fácil trabalho com XTTSV2
Processamento em lote para a dublagem de um grande número de arquivos
Capacidade de traduzir qualquer áudio com economia de voz
Capacidade de melhorar os resultados usando redes neurais e ferramentas de áudio automaticamente
Capacidade de ajustar o modelo e usá -lo imediatamente
Capacidade de usar ferramentas como: RVC , OpenVoice , se assemelham a aprimorar , tanto juntos quanto separadamente
Capacidade de personalizar a geração XTTS, todos os parâmetros, amostras múltiplas de fala

PENDÊNCIA

Adicione uma barra de status com informações de progresso e erro
Integrar o treinamento na interface padrão
Adicione a capacidade de transmitir para verificar o resultado
Adicione uma nova maneira de processar texto para voz
Adicione a capacidade de personalizar os alto -falantes ao processamento em lote
Adicione API

Instalação

Use esta interface da web através do Google Colab

Certifique -se de ter Python 3.10.x ou Python 3.11, CUDA 11.8 ou CUDA 12.1, Microsoft Builder Tools 2019 com pacote C ++ e FFMPEG instalado

1 método, através de scripts

Windows

Para começar:

Execute o arquivo 'install.bat'
Para iniciar a interface do usuário da web, execute 'start_xtts_webui.bat'
Abra seu navegador preferido e vá para o endereço local exibido no console.

Linux

Para começar:

Execute o arquivo 'install.sh'
Para iniciar a interface do usuário da web, execute 'start_xtts_webui.sh'
Abra seu navegador preferido e vá para o endereço local exibido no console.

2 Método, manual

Siga estas etapas para instalação:

Verifique se CUDA está instalado
Clone o repositório: git clone https://github.com/daswer123/xtts-webui
Navegue até o diretório: cd xtts-webui
Crie um ambiente virtual: python -m venv venv
Ative o ambiente virtual:
- No Windows Use: venvscriptsactivate
- No uso do Linux: source venvbinactivate
Instale Pytorch e Torchaudio com o comando pip:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
Instale todas as dependências do requisitos.txt:
pip install -r requirements.txt

Executando o aplicativo

Para iniciar a interface, siga estas etapas:

Iniciando XTTS Webui:

Ative seu ambiente virtual:

venv/scripts/activate

Ou se você estiver no Linux,

 source venv/bin/activate

Em seguida, inicie o webui para o XTTS executando este comando:

python app.py

Aqui estão alguns argumentos de tempo de execução que podem ser usados ao iniciar o aplicativo:

Argumento	Valor padrão	Descrição
-hs, - -hospedeiro	127.0.0.1	O anfitrião para se ligar a
-p, --port	8010	O número da porta para ouvir
-d, -Device	CUDA	Qual dispositivo usar (CPU ou CUDA)
-sf,-speaker_folder	alto -falantes/	Diretório contendo amostras TTS
-o,-saída	"saída/"	Diretório de saída
-l,-idioma	"auto"	Idioma Webui, você pode ver as traduções disponíveis na pasta i18n/localidade.
-ms,-modelo de modelo	"local"	Defina a fonte do modelo: 'API' para a versão mais recente do repositório, inferência da API ou 'local' para usar a inferência local e o modelo v2.0.2
-v, -version	"v2.0.2"	Você pode especificar qual versão do XTTS usar. Você pode especificar o nome do modelo personalizado para esse fim, coloque a pasta em modelos e especifique o nome da pasta nesta bandeira
--Lowvram		Habilite o modo VRAM baixo que alterna o modelo para RAM quando não está processando ativamente
--Spedpeed		Ativar aceleração de velocidade profunda. Funciona no Windows no Python 3.10 e 3.11
--compartilhar		Permite o compartilhamento de interface fora do computador local
--RVC		Ativar pós-processamento de RVC, todos os modelos devem localizar na pasta RVC

TTS -> RVC

Módulo para RVC, você pode ativar o módulo RVC para pós -processo do áudio recebido para isso, você precisa adicionar o sinalizador - -RVC se estiver executando no console ou escrevê -lo no arquivo de inicialização

Para que o modelo funcione nas configurações de RVC, você precisa selecionar um modelo que você deve fazer o upload para a pasta Voice2Voice/RVC, o modelo e o arquivo de índice devem estar juntos, o arquivo de índice é opcional, cada modelo deve estar em uma pasta separada.

Diferenças entre XTTS-Webui e o webui oficial

Processamento de dados

Atualizado mais rápido para 0,10.0 com a capacidade de selecionar um modelo maior-V3.
Pasta de saída alterada para a pasta de saída dentro da pasta principal.
Se já houver um conjunto de dados na pasta de saída e você quiser adicionar novos dados, você pode fazê -lo simplesmente adicionando novo áudio, o que houve lá não será processado novamente e os novos dados serão adicionados automaticamente
Ligue o filtro VAD
Após a criação do conjunto de dados, é criado um arquivo que especifica o idioma do conjunto de dados. Este arquivo é lido antes do treinamento para que o idioma sempre corresponda. É conveniente quando você reinicia a interface

Encoder XTTS de ajuste fino

Adicionado a capacidade de selecionar o modelo básico para XTTS, bem como quando você re-treinamento não precisa baixar o modelo novamente.
Capacidade adicionada de selecionar o modelo personalizado como modelo básico durante o treinamento, o que permitirá o Modelo Finetune já FineTune.
Possibilidade adicionada para obter a versão otimizada do modelo para 1 clique (Etapa 2.5, coloque a versão otimizada na pasta de saída).
Você pode escolher se deve excluir pastas de treinamento depois de otimizar o modelo
Quando você otimiza o modelo, o exemplo de áudio de referência é movido para a pasta de saída
Verificação da correção da linguagem especificada e da linguagem do conjunto de dados

Inferência

Possibilidade adicionada para personalizar configurações inferiores durante a verificação do modelo.

Outro

Se você reiniciar acidentalmente a interface durante uma das etapas, poderá carregar dados em botões adicionais
Removeu a exibição de troncos como estava causando problemas ao reiniciar
O resultado final é copiado para a pasta pronta, são arquivos totalmente acabados, você pode movê -los para qualquer lugar e usá -los como um modelo padrão
Adicionado suporte para japonês aqui

Expandir

Informações adicionais

Versão Deepspeed wheels for Windows
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-14
tamanho 1.83MB
Vindo de Github

Aplicativos Relacionados

webui_bfm

2024-11-13
JableTVDownload WebUI

2024-11-12
flux webui

2024-11-09
open webui

2024-11-03
webui

2024-11-02
stable diffusion webui

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos