Descargar XphoneBert_Vits2 - Descargar el código fuente XphoneBert

XphoneBert_Vits2

Código Fuente de IA

1.0.0

Descargar

VITS2 extendido con el codificador XphoneBert

Créditos

Este repositorio basado en el gran trabajo de Vits2 Repo y XphoneBert.

Requisitos previos

Python> = 3.10
Probado en Pytorch versión 1.13.1 con Google Colab y Lambdalabs Cloud.
Clon este repositorio
Instale los requisitos de Python. Consulte requisitos.txt
Descargar conjuntos de datos
1. Descargue y extraiga el conjunto de datos de discurso LJ, luego cambie el nombre o cree un enlace a la carpeta del conjunto de datos: ln -s /path/to/LJSpeech-1.1/wavs DUMMY
2. NOTA: Este repositorio no admitió el conjunto de datos de entrenamiento de múltiples altavoces
Mueva/copie sus archivos de capacitación, validación y prueba de .txt al directorio Filelists, y luego ejecute el archivo preprocess.py (similar a la ejecución del conjunto de datos LJSPEECch), por ejemplo:
- Consulte XphoneBert para obtener más información. Ellos utilizan text2phonemesequence para convertir el texto sin procesar en secuencia de fonema.
- La inicialización de text2phonemesequence para cada idioma requiere su código ISO 639-3 correspondiente. Los códigos ISO 639-3 de los idiomas compatibles están disponibles aquí.
- text2phonemesequence toma una secuencia segmentaria de palabras como entrada. Y los usuarios también pueden realizar la normalización de texto en la secuencia segmentaria de palabras antes de alimentar text2phonemesequence .

Nota: Para idiomas como chino, coreano, japonés (idiomas CJK) y algunos idiomas del sudeste asiático, las palabras no están separadas por espacios. Se deben usar un tokenizadores externos antes de alimentar las palabras en este modelo. En este caso, escriba un script para normalizar y segmentar su entrada antes de alimentarse a text2phonemesequence (VIE_PREPROCESS.py está en mi caso)

 # In Case languages, words are not separated by spaces such as Vietnamese.
python vie_preprocess.py --out_extension cleaned --filelists filelists/train.txt filelists/val.txt
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language vie-n --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language vie-n --batch_size 64 --cuda

# In Case languages English.
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language eng-us --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language eng-us --batch_size 64 --cuda

Cree búsqueda de alineación monotónica y ejecute preprocesamiento si usa sus propios conjuntos de datos.

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

Ejemplo de entrenamiento

Más información sobre config Consulte configs/config.json

 # LJ Speech
python train.py -c configs/config.json -m ljs_base

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-22
tamaño 24.62MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
perro_zorro_conejito

2022-08-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo