xtts webui Téléchargement - xtts webui Code source Télécharger

xtts webui

Code Source AI

Deepspeed wheels for Windows

Télécharger

Xtts-webui

Version portable

Le projet a désormais une version portable, vous n'avez donc pas à vous procéder à l'installation de toutes les dépendances.

Cliquez ici pour télécharger

Vous n'avez besoin que de Windows et d'une carte graphique NVIDIA avec 6 Go de mémoire vidéo pour l'exécuter.

L'onglet Train est cassé, si vous souhaitez former un modèle, utilisez un webui séparé

XTTS-FINETUNE-WEBUI

ReadMe est disponible dans les langues suivantes

Anglais

russe

Portuguêts

À propos du projet

XTTS-WEBUI est une interface Web qui vous permet de tirer le meilleur parti de XTTS. Il existe d'autres réseaux de neurones autour de cette interface qui amélioreront vos résultats. Vous pouvez également affiner le modèle et obtenir un modèle vocal de haute qualité.

Caractéristiques clés

Facile avec XTSTV2
Traitement par lots pour doubler un grand nombre de fichiers
Capacité à traduire tout son avec une économie de voix
Capacité à améliorer les résultats à l'aide de réseaux de neurones et d'outils audio
Capacité à affiner le modèle et à l'utiliser immédiatement
Capacité à utiliser des outils tels que: RVC , OpenVoice , ressemblent à améliorer , à la fois ensemble et séparément
Capacité à personnaliser la génération XTTS, tous les paramètres, plusieurs échantillons parlants

FAIRE

Ajouter une barre d'état avec les progrès et les informations d'erreur
Intégrer la formation dans l'interface standard
Ajouter la possibilité de diffuser pour vérifier le résultat
Ajouter une nouvelle façon de traiter le texte pour la voix off
Ajouter la possibilité de personnaliser les haut-parleurs lors du traitement par lots
Ajouter API

Installation

Utilisez cette interface utilisateur Web via Google Colab

Veuillez vous assurer d'avoir Python 3.10.x ou Python 3.11, CUDA 11.8 ou CUDA 12.1, Microsoft Builder Tools 2019 avec package C ++ et FFMPEG installé

1 méthode, à travers les scripts

Fenêtre

Pour commencer:

Exécuter le fichier 'install.bat'
Pour démarrer l'interface utilisateur Web, exécutez 'start_xtts_webui.bat'
Ouvrez votre navigateur préféré et accédez à l'adresse locale affichée dans la console.

Linux

Pour commencer:

Exécuter le fichier 'install.sh'
Pour démarrer l'interface utilisateur Web, exécutez 'start_xtts_webui.sh'
Ouvrez votre navigateur préféré et accédez à l'adresse locale affichée dans la console.

2 Méthode, manuel

Suivez ces étapes pour l'installation:

Assurez-vous que CUDA est installé
Clone The Repository: git clone https://github.com/daswer123/xtts-webui
Naviguez dans le répertoire: cd xtts-webui
Créer un environnement virtuel: python -m venv venv
Activez l'environnement virtuel:
- Sur Windows Use: venvscriptsactivate
- Sur Linux Use: source venvbinactivate
Installez Pytorch et Torchaudio avec la commande PIP:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
Installez toutes les dépendances à partir des exigences.txt:
pip install -r requirements.txt

Exécution de l'application

Pour lancer l'interface, veuillez suivre ces étapes:

Démarrage de xtts webui:

Activez votre environnement virtuel:

venv/scripts/activate

ou si vous êtes sur Linux,

 source venv/bin/activate

Démarrez ensuite le WebUI pour XTTS en exécutant cette commande:

python app.py

Voici quelques arguments d'exécution qui peuvent être utilisés lors du démarrage de l'application:

Argument	Valeur par défaut	Description
-Hs, - host	127.0.0.1	L'hôte à lier
-p, --port	8010	Le numéro de port à écouter
-D, --Device	cuda	Quel appareil utiliser (CPU ou CUDA)
-sf, - Speaker_folder	haut-parleurs /	Répertoire contenant des échantillons TTS
-o, - sortie	"sortir/"	Répertoire de sortie
-l, - langue	"auto"	Langue Webui, vous pouvez voir les traductions disponibles dans le dossier i18n / local.
-ms, - modèle de modèle	"locale"	Définissez la source du modèle: «API» pour la dernière version du référentiel, l'inférence API ou «local» pour l'utilisation de l'inférence locale et le modèle v2.0.2
-v, -version	"v2.0.2"	Vous pouvez spécifier la version de XTTS à utiliser. Vous pouvez spécifier le nom du modèle personnalisé à cet effet, mettez le dossier dans les modèles et spécifiez le nom du dossier de ce drapeau
- Lowvram		Activer le mode VRAM faible qui fait passer le modèle à RAM lors du traitement activement
- profondément		Activer l'accélération profonde. Fonctionne sur Windows sur Python 3.10 et 3.11
--partager		Permet le partage de l'interface en dehors de l'ordinateur local
- RVC		Activer le post-traitement RVC, tous les modèles doivent se trouver dans le dossier RVC

TTS -> RVC

Module pour RVC, vous pouvez permettre au module RVC de reproduire l'audio reçu pour cela, vous devez ajouter l'indicateur - RVC si vous exécutez dans la console ou l'écrivez dans le fichier de démarrage

Pour que le modèle fonctionne dans les paramètres RVC, vous devez sélectionner un modèle que vous devez d'abord télécharger dans le dossier Voice2Voice / RVC, le modèle et le fichier d'index doivent être ensemble, le fichier d'index est facultatif, chaque modèle doit être dans un dossier séparé.

Différences entre XTTS-Webui et le Webui officiel

Informatique

Mis à jour plus rapide à 0,10.0 avec la possibilité de sélectionner un modèle V3 plus grand.
Dossier de sortie modifié en dossier de sortie à l'intérieur du dossier principal.
S'il y a déjà un ensemble de données dans le dossier de sortie et que vous souhaitez ajouter de nouvelles données, vous pouvez le faire en ajoutant simplement un nouvel audio, ce qu'il n'y avait plus de traitement et les nouvelles données seront automatiquement ajoutées
Activer le filtre VAD
Une fois l'ensemble de données créé, un fichier est créé qui spécifie la langue de l'ensemble de données. Ce fichier est lu avant l'entraînement afin que la langue correspond toujours. C'est pratique lorsque vous redémarrez l'interface

Encodeur XTTS à réglage fin

Ajout de la possibilité de sélectionner le modèle de base pour les XTTS, ainsi que lorsque vous reconstituez n'a plus besoin de télécharger le modèle.
Ajout de la capacité de sélectionner le modèle personnalisé comme modèle de base pendant la formation, ce qui permettra à Finetune déjà le modèle Finetune.
Ajout de la possibilité d'obtenir une version optimisée du modèle pour 1 clic (étape 2.5, mettre une version optimisée dans le dossier de sortie).
Vous pouvez choisir de supprimer les dossiers de formation après avoir optimisé le modèle
Lorsque vous optimisez le modèle, l'exemple de référence audio est déplacé vers le dossier de sortie
Vérification de l'exactitude de la langue spécifiée et du langage de l'ensemble de données

Inférence

Possibilité ajoutée de personnaliser les paramètres d'inférer lors de la vérification du modèle.

Autre

Si vous redémarrez accidentellement l'interface pendant l'une des étapes, vous pouvez charger des données sur des boutons supplémentaires
Supprimé l'affichage des journaux car il causait des problèmes lorsqu'il a redémarré
Le résultat fini est copié dans le dossier Ready, ce sont des fichiers entièrement finis, vous pouvez les déplacer n'importe où et les utiliser comme modèle standard
Ajout du support pour le japonais ici

Développer

Informations supplémentaires

Version Deepspeed wheels for Windows
Type Code Source AI
Date de mise à jour 2025-09-14
taille 1.83MB
Provenant de Github

Applications connexes

webui_bfm

2024-11-13
JableTVDownload WebUI

2024-11-12
flux webui

2024-11-09
open webui

2024-11-03
webui

2024-11-02
stable diffusion webui

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout