Descargar PolyLangVITS - Descargar el código fuente de PolyLangVITS

PolyLangVITS

Código Fuente de IA

Pretrained_Models

Descargar

Polylangvits

Sistema de síntesis de voz multilingüe utilizando VITS

Tabla de contenido

Requisitos previos
Instalación
Preparar_datasets
Uso
Inferencia
Referencias

Requisitos previos

Un sistema de Windows/Linux con un mínimo de 16GB de RAM.
Una GPU con al menos 12GB de VRAM.
Python == 3.8
Anaconda instalada.
Pytorch instalado.
CUDA 11.X instalado.
ZLIB DLL instalado.

Comando de instalación de Pytorch:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

CUDA 11.7 Instalación: https://developer.nvidia.com/cuda-11-7-0-download-archive

Zlib dll Instalar: https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-zlib-windows

Instale PyopenJTalk manualmente: pip install -U pyopenjtalk --no-build-isolation

Si este comando no se instala, instale la siguiente biblioteca antes de continuar: cmake Cython

Instalación

Crea un entorno de Anaconda:

conda create -n polylangvits python=3.8

Activar el entorno:

conda activate polylangvits

Clone este repositorio a su máquina local:

git clone https://github.com/ORI-Muchim/PolyLangVITS.git

Navegue al directorio clonado:

 cd PolyLangVITS

Instale las dependencias necesarias:

pip install -r requirements.txt

Preparar_datasets

Coloque los archivos de audio de la siguiente manera.

.mp3 o los archivos .wav están bien.

Debe escribir '[Código de idioma]' en la parte posterior de la carpeta del altavoz.

 PolyLangVITS
├────datasets
│       ├───speaker0[KO]
│       │   ├────1.mp3
│       │   └────1.wav
│       └───speaker1[JA]
│       │    ├───1.mp3
│       │    └───1.wav
│       ├───speaker2[EN]
│       │   ├────1.mp3
│       │   └────1.wav
│       ├───speaker3[ZH]
│       │   ├────1.mp3
│       │   └────1.wav
│       ├integral.py
│       └integral_low.py
│
├────vits
├────get_pretrained_model.py
├────inference.py
├────main_low.py
├────main_resume.py
├────main.py
├────Readme.md
└────requirements.txt

Este es solo un ejemplo, y está bien agregar más altavoces.

Uso

Para iniciar esta herramienta, use el siguiente comando, reemplazando {lenguaje}, {model_name} y {sample_rate} con sus valores respectivos:

python main.py {language} {model_name} {sample_rate}

Para aquellos con bajas especificaciones (VRAM <12GB), use este código:

python main_low.py {language} {model_name} {sample_rate}

Si la configuración de datos está completa y desea reanudar la capacitación, ingrese este código:

python main_resume.py {model_name}

Inferencia

Después de que el modelo haya sido entrenado, puede generar predicciones utilizando el siguiente comando, reemplazando {model_name} y {model_step} con sus valores respectivos:

python inference.py {model_name} {model_step}

Para la inferencia de texto a voz, use lo siguiente:

python inference-stt.py {model_name} {model_step}

Además, puede pasar manualmente el texto sin editar el código por:

python inference-stt.py {model_name} {model_step} {text}

Referencias

Para obtener más información, consulte los siguientes repositorios:

jaywalnut310/vits
Cjangcjengh/vits
Kyubyong/G2PK
Tenebo/G2PK2
HenryMass/Audiosicer

Expandir

Información adicional

Versión Pretrained_Models
Tipo Código Fuente de IA
Fecha de actualización 2025-09-14
tamaño 31.98MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo

PolyLangVITS

Polylangvits