Descargar rvc_inferpy - Descargar el código fuente rvc

rvc_inferpy

Código Fuente de IA

v0.5.7-beta

Descargar

RVC inferpía

Nota

Este proyecto aún está en desarrollo.

rvc_inferpy es una biblioteca de Python para realizar una inferencia de audio con RVC (conversión de voz basada en la recuperación). Proporciona una interfaz de línea de comandos simple (CLI) y puede integrarse en proyectos de Python para el procesamiento de audio con parámetros personalizables.

Instalación

Puede instalar el paquete con pip :

pip install rvc-inferpy

Uso

Interfaz de línea de comandos (CLI)

Puede interactuar con rvc_inferpy a través de la línea de comando. Para ver las opciones disponibles y cómo usar la herramienta, ejecute:

rvc-cli -h

Aquí hay un desglose de las opciones completas de línea de comandos:

usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH] 
                 [--f0_change F0_CHANGE] [--f0_method F0_METHOD] 
                 [--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH] 
                 [--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE] 
                 [--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE] 
                 [--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE] 
                 [--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP] 
                 [--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY] 
                 [--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT] 
                 [--resample_sr RESAMPLE_SR]

Opciones de línea de comandos:

-h, --help : Mostrar mensaje de ayuda y salida.
--model_name MODEL_NAME : nombre o ruta del modelo.
--audio_path AUDIO_PATH : ruta al archivo de audio de entrada.
--f0_change F0_CHANGE : factor de cambio de tono.
--f0_method F0_METHOD : método para la estimación F0 (por ejemplo, "crepe").
--min_pitch MIN_PITCH : valor mínimo de tono.
--max_pitch MAX_PITCH : valor máximo de tono.
--crepe_hop_length CREPE_HOP_LENGTH : crepe hop longitud.
--index_rate INDEX_RATE : tasa de índice.
--filter_radius FILTER_RADIUS : radio de filtro.
--rms_mix_rate RMS_MIX_RATE : RMS Mix Tasa.
--protect PROTECT : Protect Factor para evitar la distorsión.
--split_infer : habilitar la inferencia dividida.
--min_silence MIN_SILENCE : duración mínima de silencio (en segundos).
--silence_threshold SILENCE_THRESHOLD : umbral de silencio en DB.
--seek_step SEEK_STEP : tamaño de paso para la detección de silencio.
--keep_silence KEEP_SILENCE : duración para mantener el silencio (en segundos).
--do_formant : habilitar el procesamiento de formantes.
--quefrency QUEFRENCY : Ajuste de Quefrence.
--timbre TIMBRE : factor de ajuste de timbre.
--f0_autotune : habilitar el ajuste automático de F0.
--audio_format AUDIO_FORMAT : formato de audio de salida deseado (por ejemplo, "wav", "mp3").
--resample_sr RESAMPLE_SR : Redamisión de muestras.

Comando de ejemplo:

rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800

Como dependencia en un proyecto de Python

También puede usar rvc_inferpy directamente en sus proyectos de Python. Aquí hay un ejemplo:

 from rvc_inferpy import infer_audio

inferred_audio = infer_audio (
    MODEL_NAME = "model_name_here" ,       # Name or path to the RVC model
    SOUND_PATH = "path_to_audio.wav" ,     # Path to the input audio file
    F0_CHANGE = 0 ,                        # Change in fundamental frequency
    F0_METHOD = "crepe" ,                  # F0 extraction method ("crepe", "dio", etc.)
    MIN_PITCH = 50 ,                       # Minimum pitch value
    MAX_PITCH = 800 ,                      # Maximum pitch value
    CREPE_HOP_LENGTH = 128 ,               # Hop length for Crepe
    INDEX_RATE = 1.0 ,                     # Index rate for model inference
    FILTER_RADIUS = 3 ,                    # Radius for smoothing filters
    RMS_MIX_RATE = 0.75 ,                  # Mixing rate for RMS
    PROTECT = 0.33 ,                       # Protect level to prevent overfitting
    SPLIT_INFER = True ,                   # Whether to split audio for inference
    MIN_SILENCE = 0.5 ,                    # Minimum silence duration for splitting
    SILENCE_THRESHOLD = - 40 ,              # Silence threshold in dB
    SEEK_STEP = 10 ,                       # Seek step in milliseconds
    KEEP_SILENCE = 0.1 ,                   # Keep silence duration in seconds
    QUEFRENCY = 0.0 ,                      # Cepstrum quefrency adjustment
    TIMBRE = 1.0 ,                         # Timbre preservation level
    F0_AUTOTUNE = False ,                  # Enable or disable F0 autotuning
    OUTPUT_FORMAT = "wav"                 # Desired output format (e.g., "wav", "mp3")
)

La función infer_audio devolverá el objeto de audio procesado en función de los parámetros proporcionados

También puede usar este nuevo modo de inferencia

 from rvc_inferpy import infernew


infer = infernew(
    model_name="model_name_here",
    sound_path="path_to_audio.wav",
    f0_change=0
)

output_audio = infer.run_inference()
print("Inference completed:", output_audio)

Descargar modelos

También puede descargar sus propios modelos RVC usando


from rvc_inferpy import download_rvc_model dlrvc

dlrvc("URL_HERE", "model_name")

Nota

Los modelos downloas solo permitieron los enlaces Huggingface, Google Drive, and Pixeldrain .

Consejo

Asegúrese de cargar sus modelos en la carpeta models/{model_name} .

Condiciones de uso

Se prohíbe el uso de la voz convertida para los siguientes fines.

Criticar o atacar a los individuos.
Defender u oponerse a posiciones políticas específicas, religiones o ideologías.
Mostrando públicamente expresiones fuertemente estimulantes sin la zonificación adecuada.
Venta de modelos de voz y clips de voz generados.
Suplantación del propietario original de la voz con intenciones maliciosas de dañar/dañar a otros.
Propósitos fraudulentos que conducen al robo de identidad o llamadas telefónicas fraudulentas.

Descargo de responsabilidad

No soy responsable de los daños directos, indirectos, consecuentes, incidentales o especiales que surgen de cualquier manera relacionada con el uso/mal uso o incapacidad de usar este software.