Descargar AICoverGen - Descargar el código fuente AICoverGen

AICoverGen

Otro código fuente

1.0.0

Descargar

Aicovergen

Una tubería autónoma para crear cubiertas con cualquier voz de IA capacitada por RVC V2 desde videos de YouTube o un archivo de audio local. Para los desarrolladores que quieran agregar una funcionalidad de canto a su asistente de IA/chatbot/vtuber, o para las personas que desean escuchar a sus personajes favoritos cantar su canción favorita.

Showcase: https://www.youtube.com/watch?v=2qzue4wm7cm

Guía de configuración: https://www.youtube.com/watch?v=pdlhk4vvhqk

Webui está bajo desarrollo y pruebas constantes, ¡pero puede probarlo ahora mismo en Local y Colab!

Colegio de cambios

Webui para conversiones más fáciles y descarga de modelos de voz
Soporte para las generaciones de portada de un archivo de audio local
Opción para mantener los archivos intermedios generados. por ejemplo, voces/instrumentales aislados
Descargar modelos de voz públicos sugeridos de la tabla con filtros de búsqueda/etiqueta
Soporte para enlaces de descarga de PixelDrain para modelos de voz
Implementar una nueva técnica de extracción de tono RMVPE para conversiones vocales de calidad más rápida y de mayor calidad
Control de volumen para voces principales de IA, voces e instrumentales
Tasa de índice para la conversión de voz
Control de reverberación para las voces principales de IA
Opción local de intercambio de redes para WebUI
Opciones de RVC adicionales - Filter_radius, RMS_MIX_RATE, Proteger
Carga de archivo local a través de la opción del navegador de archivos
Carga de modelos RVC V2 capacitados localmente a través de WebUI
Control del método de detección de tono, por ejemplo, RMVPE/MANGIO-CREPE
Cambio de lanzamiento para voces e instrumentales juntos. El mismo efecto que cambiar la clave de la canción en el karaoke.
Opción de formato de salida de audio: WAV o MP3.

Actualizar AiCovergen a la última versión

Instale y extraiga cualquier nuevo requisito y cambio abriendo una ventana de línea de comandos en el directorio AICoverGen y ejecutando los siguientes comandos.

 pip install -r requirements.txt
git pull

Para los usuarios de Colab, simplemente haga clic en Runtime en la barra de navegación superior del cuaderno de Colab y Disconnect and delete runtime en el menú desplegable. Luego siga las instrucciones en el cuaderno para ejecutar el webui.

Cuaderno de colab

Para aquellos que no tienen una GPU NVIDIA lo suficientemente potente, pueden probar AiCovergen Out usando Google Colab.

Para aquellos que enfrentan problemas con la desconexión del cuaderno de Google Colab después de unos minutos, aquí hay una alternativa que no usa el WebUI.

Para aquellos que desean ejecutar esto localmente, siga la guía de configuración a continuación.

Configuración

Instalar git y python

Siga las instrucciones aquí para instalar Git en su computadora. También siga esta guía para instalar Python versión 3.9 si aún no lo ha hecho. El uso de otras versiones de Python puede dar lugar a conflictos de dependencia.

Instalar ffmpeg

Siga las instrucciones aquí para instalar FFMPEG en su computadora.

Instalar SOX

Siga las instrucciones aquí para instalar Sox y agréguelo a su entorno de ruta de Windows.

Repositorio de clonos AiCovergen

Abra una ventana de línea de comando y ejecute estos comandos para clonar todo este repositorio e instalar las dependencias adicionales requeridas.

 git clone https://github.com/SociallyIneptWeeb/AICoverGen
cd AICoverGen
pip install -r requirements.txt

Descargue los modelos requeridos

Ejecute el siguiente comando para descargar los modelos de separación vocal MDXNet requeridos y el modelo base Hubert.

 python src/download_models.py

Uso con Webui

Para ejecutar AiCovergen WebUI, ejecute el siguiente comando.

 python src/webui.py

Bandera	Descripción
`-h` , `--help`	Muestre este mensaje de ayuda y salida.
`--share`	Crear una URL pública. Esto es útil para ejecutar la interfaz de usuario web en Google Colab.
`--listen`	Haga que la interfaz de usuario web sea accesible desde su red local.
`--listen-host LISTEN_HOST`	El nombre de host que usará el servidor.
`--listen-port LISTEN_PORT`	El puerto de escucha que usará el servidor.

Una vez que aparece el siguiente mensaje de salida Running on local URL: http://127.0.0.1:7860 , puede hacer clic en el enlace para abrir una pestaña con el webui.

Descargar modelos RVC a través de Webui

Navegue a la pestaña Download model y pegue el enlace de descarga al modelo RVC y dale un nombre único. Puede buscar en la discordia del centro de AI donde los modelos de voz ya entrenados están disponibles para descargar. Puede consultar los ejemplos de cómo debería ser el enlace de descarga. El archivo zip descargado debe contener el archivo del modelo .pth y un archivo .index opcional.

Una vez que se completan los 2 campos de entrada, simplemente haga clic en Download ! ¡Una vez que el mensaje de salida dice [NAME] Model successfully downloaded! ¡Debería poder usarlo en la pestaña Generate después de hacer clic en el botón Rebresh Models!

Subir modelos RVC a través de WebUI

Para las personas que han entrenado modelos RVC V2 localmente y desean usarlos para las generaciones de portada de IA. Navegue a la pestaña Upload model y siga las instrucciones. ¡Una vez que el mensaje de salida dice [NAME] Model successfully uploaded! ¡Debería poder usarlo en la pestaña Generate después de hacer clic en el botón Rebresh Models!

Ejecutando la tubería a través de Webui

Desde el menú desplegable Modelos de voz, seleccione el modelo de voz para usar. Haga clic en Update si agregó los archivos manualmente al directorio RVC_Models para actualizar la lista.
En el campo de entrada de la canción, copie y pegue el enlace a cualquier canción en YouTube o la ruta completa a un archivo de audio local.
El tono debe establecerse en -12, 0 o 12 dependiendo de las voces originales y el modal RVC AI. Esto asegura que la voz no esté fuera de sintonía .
Se pueden ver otras opciones avanzadas para la conversión de voz y la mezcla de audio haciendo clic en la flecha de acordeón para expandirse.

Una vez que se completen todas las opciones principales, haga clic en Generate y la cubierta generada por IA debe aparecer en menos de unos minutos dependiendo de su GPU.

Uso con CLI

Descarga manual de modelos RVC

Unzip (si es necesario) y transfiera los archivos .pth y .index a una nueva carpeta en el directorio rvc_models. Cada carpeta solo debe contener un archivo .pth y un .index .

La estructura del directorio debería verse algo así:

 ├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src

Ejecutando la tubería

Para ejecutar la tubería de generación de cobertura de IA usando la línea de comando, ejecute el siguiente comando.

 python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]

Bandera	Descripción
`-h` , `--help`	Muestre este mensaje de ayuda y salida.
`-i SONG_INPUT`	Enlace a una canción en YouTube o ruta a un archivo de audio local. Debe estar encerrado en cotizaciones dobles para Windows y citas individuales para sistemas similares a UNIX.
`-dir MODEL_DIR_NAME`	Nombre de la carpeta en el directorio rvc_models que contiene sus archivos `.pth` y `.index` para una voz específica.
`-p PITCH_CHANGE`	Cambiar el lanzamiento de las voces de IA en octavas. Establecer en 0 para no cambiar. En general, use 1 para conversiones masculinas a femeninas y -1 para viceversa.
`-k`	Opcional. Se puede agregar para mantener todos los archivos de audio intermedios generados. por ejemplo, voces/instrumentales aislados de IA. Deje fuera para ahorrar espacio.
`-ir INDEX_RATE`	Opcional. Predeterminado 0.5. Controle cuánto del acento de la IA dejar en la voz. 0 <= index_rate <= 1.
`-fr FILTER_RADIUS`	Opcional. Predeterminado 3. IF> = 3: Aplicar el filtrado mediano de filtrado mediano a los resultados del tono cosechado. 0 <= Filter_radius <= 7.
`-rms RMS_MIX_RATE`	Opcional. Predeterminado 0.25. Controle cuánto usar el volumen de la voz original (0) o un volumen fijo (1). 0 <= rms_mix_rate <= 1.
`-palgo PITCH_DETECTION_ALGO`	Opcional. RMVPE predeterminado. La mejor opción es RMVPE (claridad en la voz), luego Mangio-CREPE (voces más suaves).
`-hop CREPE_HOP_LENGTH`	Opcional. Predeterminado 128. Controla con qué frecuencia verifica los cambios de tono en milisegundos cuando se usa específicamente algo Mangio-Crepe. Los valores más bajos conducen a conversiones más largas y un mayor riesgo de grietas de voz, pero una mejor precisión del tono.
`-pro PROTECT`	Opcional. Predeterminado 0.33. Controle cuánto de la aliento de las voces originales y las consonantes sin voz para dejar en las voces de IA. Establecer 0.5 para deshabilitar. 0 <= proteger <= 0.5.
`-mv MAIN_VOCALS_VOLUME_CHANGE`	Opcional. Predeterminado 0. Volumen de control de las principales voces de IA. Use -3 para disminuir el volumen en 3 decibelios, o 3 para aumentar el volumen en 3 decibelios.
`-bv BACKUP_VOCALS_VOLUME_CHANGE`	Opcional. Predeterminado 0. Volumen de control de las voces de AI de respaldo.
`-iv INSTRUMENTAL_VOLUME_CHANGE`	Opcional. Predeterminado 0. Volumen de control de la música/instrumentos de fondo.
`-pall PITCH_CHANGE_ALL`	Opcional. Predeterminado 0. Cambie el tono/clave de la música de fondo, la voz de copia de seguridad y las voces de IA en los semitonos. Reduce ligeramente la calidad del sonido.
`-rsize REVERB_SIZE`	Opcional. Predeterminado 0.15. Cuanto más grande sea la habitación, más tiempo será el tiempo de la reverberación. 0 <= reverb_size <= 1.
`-rwet REVERB_WETNESS`	Opcional. Predeterminado 0.2. Nivel de voces de IA con reverb. 0 <= reverb_wetness <= 1.
`-rdry REVERB_DRYNESS`	Opcional. Predeterminado 0.8. Nivel de voces de IA sin reverberación. 0 <= Reverb_Dryness <= 1.
`-rdamp REVERB_DAMPING`	Opcional. Predeterminado 0.7. Absorción de altas frecuencias en la reverb. 0 <= reverb_damping <= 1.
`-oformat OUTPUT_FORMAT`	Opcional. MP3 predeterminado. WAV para la mejor calidad y tamaño de archivo grande, MP3 para calidad decente y tamaño de archivo pequeño.

Condiciones de uso

Se prohíbe el uso de la voz convertida para los siguientes fines.

Criticar o atacar a los individuos.
Defender u oponerse a posiciones políticas específicas, religiones o ideologías.
Mostrando públicamente expresiones fuertemente estimulantes sin la zonificación adecuada.
Venta de modelos de voz y clips de voz generados.
Suplantación del propietario original de la voz con intenciones maliciosas de dañar/dañar a otros.
Propósitos fraudulentos que conducen al robo de identidad o llamadas telefónicas fraudulentas.

Descargo de responsabilidad

No soy responsable de los daños directos, indirectos, consecuentes, incidentales o especiales que surgen de cualquier manera relacionada con el uso/mal uso o incapacidad de usar este software.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-02-23
tamaño 474.27KB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo