Descarga Retrieval based Voice Conversion WebUI - Descarga de código fuente Retrieval based Voice Conversion WebUI

Retrieval based Voice Conversion WebUI

Otro código fuente

2.2.231006

Descargar

WebUI de conversión de voz basada en recuperación

Un marco de cambio de voz simple y fácil de usar basado en VITS

Registro de actualización | Preguntas frecuentes | AutoDL·50 centavos para entrenar al cantante de IA | Demostración en línea |

Inglés |中文简体|日本语| 한국어 ( coreano ) |

El modelo base se entrena utilizando casi 50 horas de conjunto de capacitación VCTK de código abierto y de alta calidad. No hay problemas de derechos de autor. No dude en utilizarlo.

Espere con ansias el modelo inferior de RVCv3, que tiene parámetros más grandes, datos más grandes, mejores resultados, básicamente la misma velocidad de inferencia y requiere menos datos de entrenamiento.

Interfaz de inferencia de entrenamiento	Interfaz de cambio de voz en tiempo real

go-web.bat	go-realtime-gui.bat
Eres libre de elegir lo que quieres hacer.	Hemos logrado una latencia de extremo a extremo de 170 ms. Si utiliza dispositivos de entrada y salida ASIO, puede lograr una latencia de extremo a extremo de 90 ms, pero depende en gran medida de la compatibilidad con controladores de hardware.

Introducción

Este almacén tiene las siguientes características.

Utilice la búsqueda top1 para reemplazar las funciones de la fuente de entrada con funciones del conjunto de entrenamiento para evitar fugas de timbre
Entrenamiento rápido incluso en tarjetas gráficas relativamente pobres
Usar una pequeña cantidad de datos para el entrenamiento también puede producir mejores resultados (se recomienda recopilar al menos 10 minutos de datos de voz con poco ruido)
El timbre se puede cambiar mediante la fusión de modelos (con la ayuda de ckpt-merge en la pestaña de procesamiento de ckpt)
Interfaz web sencilla y fácil de usar.
Se puede llamar al modelo UVR5 para separar rápidamente las voces y el acompañamiento.
Utilice el algoritmo de extracción de tono de voz humana más avanzado, InterSpeech2023-RMVPE, para eliminar el problema de los sonidos mudos. Funciona mejor (significativamente) pero es más rápido y más pequeño que crepe_full
Soporte de aceleración de tarjeta I tarjeta

¡Haga clic aquí para ver nuestro vídeo de demostración!

Configuración del entorno

Las siguientes instrucciones deben ejecutarse en un entorno con una versión de Python superior a 3.8.

Métodos comunes para Windows/Linux/MacOS y otras plataformas

Elija uno de los siguientes métodos.

1. Instalar dependencias a través de pip

Instale Pytorch y sus dependencias principales, omítalo si ya está instalado. Referencia de: https://pytorch.org/get-started/locally/

 pip instalar antorcha torchvision torchaudio

Si es un sistema win + arquitectura Nvidia Ampere (RTX30xx), según la experiencia del n.° 21, debe especificar la versión de cuda correspondiente a pytorch

 pip instalar antorcha torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

Instale las dependencias correspondientes según su propia tarjeta gráfica.

tarjeta n

 instalación de pip -r requisitos.txt

Una tarjeta/yo tarjeta

 instalación de pip -r requisitos-dml.txt

Una tarjeta ROCM (Linux)

 instalación de pip -r requisitos-amd.txt

Tarjeta IIPEX (Linux)

 instalación de pip -r requisitos-ipex.txt

2. Instalar dependencias a través de poesía.

Instale la herramienta de gestión de dependencias de Poetry, omítala si ya está instalada. Referencia de: https://python-poetry.org/docs/#installation

 curl -sSL https://install.python-poetry.org |

Al instalar dependencias a través de Poetry, se recomienda que Python utilice las versiones 3.7-3.10. Otras versiones entrarán en conflicto al instalar llvmlite==0.39.0.

 inicio de poesía -n
env de poesía use "ruta a su python.exe" poesía ejecute pip install -r requisitos.txt

Mac OS

Las dependencias se pueden instalar a través de run.sh

 sh ./run.sh

Otra preparación previa al modelo

RVC requiere algunos otros modelos previos para la inferencia y el entrenamiento.

Puedes descargar estos modelos desde nuestro espacio Hugging Face.

1. Descargar recursos

A continuación se muestra una lista con los nombres de todos los modelos previos y otros archivos necesarios para RVC. Puede encontrar los scripts para descargarlos en la carpeta tools .

./assets/hubert/hubert_base.pt
./assets/preentrenado
./assets/uvr5_weights

Si desea utilizar el modelo de la versión v2, debe descargarlo adicionalmente.

./assets/pretrained_v2

2. Instale ffmpeg

Omita si ffmpeg y ffprobe ya están instalados.

Usuarios de Ubuntu/Debian

 sudo apto instalar ffmpeg

Usuarios de MacOS

 instalar cerveza ffmpeg

Usuarios de Windows

Después de la descarga, colóquelo en el directorio raíz.

Descargar ffmpeg.exe
Descargar ffprobe.exe

3. Descargue los archivos necesarios para el algoritmo de extracción de tono de voz humana rmvpe

Si desea utilizar el último algoritmo de extracción de tono vocal RMVPE, debe descargar los parámetros del modelo de extracción de tono y colocarlos en el directorio raíz de RVC.

descargarrmvpe.pt

Descargue el entorno dml de rmvpe (opcional, usuarios de tarjeta A/tarjeta I)

Descargarrmvpe.onnx

4. Tarjeta gráfica AMD Rocm (opcional, solo Linux)

Si desea ejecutar RVC en un sistema Linux basado en la tecnología Rocm de AMD, primero instale aquí los controladores necesarios.

Si está utilizando Arch Linux, puede utilizar pacman para instalar los controladores necesarios:

pacman -S rocm-hip-sdk rocm-opencl-sdk

Para algunos modelos de tarjetas gráficas, es posible que necesite configurar adicionalmente las siguientes variables de entorno (por ejemplo: RX6700XT):

export ROCM_PATH=/opt/rocm
export HSA_OVERRIDE_GFX_VERSION=10.3.0

También asegúrese de que su usuario actual esté en render y video :

sudo usermod -aG render $USERNAME
sudo usermod -aG video $USERNAME

empezar

inicio directo

Utilice el siguiente comando para iniciar WebUI

 Python inferir-web.py

Si anteriormente usó Poetry para instalar dependencias, puede iniciar WebUI de la siguiente manera

 poesía ejecutar python infer-web.py

Utilice paquetes de integración

Descargue y descomprima RVC-beta.7z

Usuarios de Windows

Haga doble clic go-web.bat

Usuarios de MacOS

 sh ./run.sh

Para usuarios de I-card que necesitan utilizar tecnología IPEX (solo Linux)

 fuente /opt/intel/oneapi/setvars.sh

Expandir

Información adicional

Versión 2.2.231006
Tipo Otro código fuente
Fecha de actualización 2024-11-01
tamaño 50MB
Proviene de Github

Aplicaciones relacionadas

JableTVDownload WebUI

2024-11-12
flux webui

2024-11-09
stable diffusion webui forge

2024-11-08
open webui

2024-11-03
GLM 4 Voice

2024-11-02
stable diffusion webui

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo