O projeto agora possui uma versão portátil, para que você não precise ter o trabalho de instalar todas as dependências.
Clique aqui para baixar
Você não precisa de nada além do Windows e uma placa gráfica da NVIDIA com 6 GB de memória de vídeo para executá -la.
Inglês
russo
Português
XTTS-Webui é uma interface da web que permite aproveitar ao máximo o XTTS. Existem outras redes neurais em torno dessa interface que melhorarão seus resultados. Você também pode ajustar o modelo e obter um modelo de voz de alta qualidade.

Use esta interface da web através do Google Colab
Certifique -se de ter Python 3.10.x ou Python 3.11, CUDA 11.8 ou CUDA 12.1, Microsoft Builder Tools 2019 com pacote C ++ e FFMPEG instalado
Para começar:
Para começar:
Siga estas etapas para instalação:
Verifique se CUDA está instalado
Clone o repositório: git clone https://github.com/daswer123/xtts-webui
Navegue até o diretório: cd xtts-webui
Crie um ambiente virtual: python -m venv venv
Ative o ambiente virtual:
venvscriptsactivatesource venvbinactivateInstale Pytorch e Torchaudio com o comando pip:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
Instale todas as dependências do requisitos.txt:
pip install -r requirements.txt
Para iniciar a interface, siga estas etapas:
Ative seu ambiente virtual:
venv/scripts/activateOu se você estiver no Linux,
source venv/bin/activateEm seguida, inicie o webui para o XTTS executando este comando:
python app.pyAqui estão alguns argumentos de tempo de execução que podem ser usados ao iniciar o aplicativo:
| Argumento | Valor padrão | Descrição |
|---|---|---|
| -hs, - -hospedeiro | 127.0.0.1 | O anfitrião para se ligar a |
| -p, --port | 8010 | O número da porta para ouvir |
| -d, -Device | CUDA | Qual dispositivo usar (CPU ou CUDA) |
| -sf,-speaker_folder | alto -falantes/ | Diretório contendo amostras TTS |
| -o,-saída | "saída/" | Diretório de saída |
| -l,-idioma | "auto" | Idioma Webui, você pode ver as traduções disponíveis na pasta i18n/localidade. |
| -ms,-modelo de modelo | "local" | Defina a fonte do modelo: 'API' para a versão mais recente do repositório, inferência da API ou 'local' para usar a inferência local e o modelo v2.0.2 |
| -v, -version | "v2.0.2" | Você pode especificar qual versão do XTTS usar. Você pode especificar o nome do modelo personalizado para esse fim, coloque a pasta em modelos e especifique o nome da pasta nesta bandeira |
| --Lowvram | Habilite o modo VRAM baixo que alterna o modelo para RAM quando não está processando ativamente | |
| --Spedpeed | Ativar aceleração de velocidade profunda. Funciona no Windows no Python 3.10 e 3.11 | |
| --compartilhar | Permite o compartilhamento de interface fora do computador local | |
| --RVC | Ativar pós-processamento de RVC, todos os modelos devem localizar na pasta RVC |
Módulo para RVC, você pode ativar o módulo RVC para pós -processo do áudio recebido para isso, você precisa adicionar o sinalizador - -RVC se estiver executando no console ou escrevê -lo no arquivo de inicialização
Para que o modelo funcione nas configurações de RVC, você precisa selecionar um modelo que você deve fazer o upload para a pasta Voice2Voice/RVC, o modelo e o arquivo de índice devem estar juntos, o arquivo de índice é opcional, cada modelo deve estar em uma pasta separada.