XphoneBert_Vits2 Télécharger - XphoneBert_Vits2 Téléchargement du code source

XphoneBert_Vits2

Code Source AI

1.0.0

Télécharger

VITS2 étendu avec le codeur XPhonebert

Crédits

Ce référentiel basé sur le grand travail de VITS2 Repo et Xphonebert.

Condition préalable

Python> = 3.10
Testé sur Pytorch version 1.13.1 avec Google Colab et Lambdalabs Cloud.
Cloner ce référentiel
Installez les exigences Python. Veuillez référer les exigences.txt
Télécharger des ensembles de données
1. Télécharger et extraire l'ensemble de données LJ Speech, puis renommer ou créer un lien vers le dossier de l'ensemble de données: ln -s /path/to/LJSpeech-1.1/wavs DUMMY
2. Remarque: ce repo ne prend pas en charge
Déplacez / copiez vos fichiers de formation, de validation et de test .txt dans le répertoire FileLists, puis exécutez le fichier Preprocess.py (similaire à AS Run pour l'ensemble de données LJSpeech), par exemple:
- Veuillez vous référer à Xphonebert pour plus d'informations. Ils utilisent text2phonemesequence pour convertir le texte brut en séquence de phonèmes.
- L'initialisation de text2phonemesequence pour chaque langue nécessite son code ISO 639-3 correspondant. Les codes ISO 639-3 des langues prises en charge sont disponibles ici.
- text2phonemesequence prend une séquence segmentée par mot en entrée. Et les utilisateurs peuvent également effectuer une normalisation de texte sur la séquence segmentée de mot avant de se nourrir dans text2phonemesequence .

Remarque: Pour les langues telles que chinois, coréenne, japonaise (langues CJK) et certaines langues d'Asie du Sud-Est, les mots ne sont pas séparés par des espaces. Un jeton externe doit être utilisé avant de nourrir les mots dans ce modèle. Dans ce cas, écrivez un script pour normaliser et segmenter votre entrée avant de vous nourrir à text2phonemesequence (VIE_PREPROCESS.py est dans mon cas)

 # In Case languages, words are not separated by spaces such as Vietnamese.
python vie_preprocess.py --out_extension cleaned --filelists filelists/train.txt filelists/val.txt
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language vie-n --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language vie-n --batch_size 64 --cuda

# In Case languages English.
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language eng-us --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language eng-us --batch_size 64 --cuda

Créez la recherche d'alignement monotonique et exécutez le prétraitement si vous utilisez vos propres ensembles de données.

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

Exemple de formation

Plus d'informations sur la configuration se réfèrent à configs/config.json

 # LJ Speech
python train.py -c configs/config.json -m ljs_base

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-22
taille 24.62MB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Chien_Renard_Lapin

2022-08-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout