vits mandarin biaobei Descargar - vits mandarin biaobei Código fuente de descarga

vits mandarin biaobei

Código Fuente de IA

1.0.0

Descargar

VITS: Autoencoder de variacional condicional con aprendizaje adversario para texto a discurso de extremo a extremo

Jaehyeon Kim, Jungil Kong y Juhee Son

En nuestro artículo reciente, proponemos VIT: autoencoder de variacional condicional con aprendizaje adversario para texto a voz de extremo a extremo.

Se han propuesto varios modelos recientes de texto a discurso (TTS) de extremo a extremo que permiten entrenamiento de una sola etapa y muestreo paralelo, pero su calidad de muestra no coincide con la de los sistemas TTS de dos etapas. En este trabajo, presentamos un método TTS de extremo a extremo paralelo que genera un audio de sonido más natural que los modelos actuales de dos etapas. Nuestro método adopta una inferencia variacional aumentada con flujos de normalización y un proceso de entrenamiento adversario, lo que mejora el poder expresivo del modelado generativo. También proponemos un predictor de duración estocástica para sintetizar el habla con diversos ritmos del texto de entrada. Con el modelado de incertidumbre sobre las variables latentes y el predictor de duración estocástica, nuestro método expresa la relación natural de uno a muchos en la que se puede hablar una entrada de texto de múltiples maneras con diferentes lanzamientos y ritmos. Una evaluación humana subjetiva (puntaje de opinión media, o MOS) en el discurso LJ, un conjunto de datos de oradores único, muestra que nuestro método supera a los mejores sistemas TTS disponibles públicamente y logra un MOS comparable a la verdad terrestre.

Visite nuestra demostración para muestras de audio.

También proporcionamos los modelos previos a la aparición.

** Nota de actualización: Gracias a Rishikesh (ऋषिकेश), nuestra demostración interactiva de TTS ya está disponible en Colab Notebook.

Vits en el entrenamiento	Vits a inferencia

Requisitos previos

Python> = 3.6
Clon este repositorio
Instale los requisitos de Python. Consulte requisitos.txt
1. Es posible que deba instalar Espeak primero: apt-get install espeak
Descargar conjuntos de datos
1. Descargue y extraiga el conjunto de datos de discurso LJ, luego cambie el nombre o cree un enlace a la carpeta del conjunto de datos: ln -s /path/to/LJSpeech-1.1/wavs DUMMY1
2. Para la configuración de múltiples altas, descargue y extraiga el conjunto de datos VCTK, y los archivos WAV de muestra a 22050 Hz. Luego cambie el nombre o cree un enlace a la carpeta del conjunto de datos: ln -s /path/to/VCTK-Corpus/downsampled_wavs DUMMY2
Cree búsqueda de alineación monotónica y ejecute preprocesamiento si usa sus propios conjuntos de datos.

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

# Preprocessing (g2p) for your own datasets. Preprocessed phonemes for LJ Speech and VCTK have been already provided.
# python preprocess.py --text_index 1 --filelists filelists/ljs_audio_text_train_filelist.txt filelists/ljs_audio_text_val_filelist.txt filelists/ljs_audio_text_test_filelist.txt 
# python preprocess.py --text_index 2 --filelists filelists/vctk_audio_sid_text_train_filelist.txt filelists/vctk_audio_sid_text_val_filelist.txt filelists/vctk_audio_sid_text_test_filelist.txt

Entrenamiento Exmaple

 # LJ Speech
python train.py -c configs/ljs_base.json -m ljs_base

# VCTK
python train_ms.py -c configs/vctk_base.json -m vctk_base

Ejemplo de inferencia

Ver inferencia.ipynb

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-24
tamaño 963.36KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
BROMA

2024-02-26

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo