rvc_inferpy Téléchargement - rvc_inferpy Code source Télécharger

rvc_inferpy

Code Source AI

v0.5.7-beta

Télécharger

RVC Inferpy

Note

Ce projet est toujours en cours de développement.

rvc_inferpy est une bibliothèque Python pour effectuer une inférence audio avec RVC (conversion vocale basée sur la récupération). Il fournit une interface de ligne de commande simple (CLI) et peut être intégré dans des projets Python pour le traitement audio avec des paramètres personnalisables.

Installation

Vous pouvez installer le package à l'aide de pip :

pip install rvc-inferpy

Usage

Interface de ligne de commande (CLI)

Vous pouvez interagir avec rvc_inferpy via la ligne de commande. Pour afficher les options disponibles et comment utiliser l'outil, exécutez:

rvc-cli -h

Voici une ventilation des options de ligne de commande complètes:

usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH] 
                 [--f0_change F0_CHANGE] [--f0_method F0_METHOD] 
                 [--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH] 
                 [--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE] 
                 [--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE] 
                 [--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE] 
                 [--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP] 
                 [--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY] 
                 [--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT] 
                 [--resample_sr RESAMPLE_SR]

Options de ligne de commande:

-h, --help : montrez le message d'aide et la sortie.
--model_name MODEL_NAME : nom ou chemin du modèle.
--audio_path AUDIO_PATH : Chemin vers le fichier audio d'entrée.
--f0_change F0_CHANGE : facteur de changement de hauteur.
--f0_method F0_METHOD : Méthode pour l'estimation F0 (par exemple, "crêpe").
--min_pitch MIN_PITCH : valeur de tangage minimale.
--max_pitch MAX_PITCH : valeur de tangage maximale.
--crepe_hop_length CREPE_HOP_LENGTH : longueur de houblon de crêpe.
--index_rate INDEX_RATE : taux d'index.
--filter_radius FILTER_RADIUS : rayon de filtre.
--rms_mix_rate RMS_MIX_RATE : RMS MIX TAX.
--protect PROTECT : Protect Facteur pour éviter la distorsion.
--split_infer : activer l'inférence divisée.
--min_silence MIN_SILENCE : Durée de silence minimale (en secondes).
--silence_threshold SILENCE_THRESHOLD : Seuil Silence dans DB.
--seek_step SEEK_STEP : taille étape pour la détection du silence.
--keep_silence KEEP_SILENCE : durée pour garder le silence (en secondes).
--do_formant : activer le traitement du formant.
--quefrency QUEFRENCY : Réglage de Quefrenncy.
--timbre TIMBRE : facteur de réglage du timbre.
--f0_autotune : Activer le réglage automatique F0.
--audio_format AUDIO_FORMAT : Format audio de sortie souhaité (par exemple, "wav", "mp3").
--resample_sr RESAMPLE_SR : Resampon la fréquence d'échantillonnage.

Exemple de commande:

rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800

En tant que dépendance dans un projet Python

Vous pouvez également utiliser rvc_inferpy directement dans vos projets Python. Voici un exemple:

 from rvc_inferpy import infer_audio

inferred_audio = infer_audio (
    MODEL_NAME = "model_name_here" ,       # Name or path to the RVC model
    SOUND_PATH = "path_to_audio.wav" ,     # Path to the input audio file
    F0_CHANGE = 0 ,                        # Change in fundamental frequency
    F0_METHOD = "crepe" ,                  # F0 extraction method ("crepe", "dio", etc.)
    MIN_PITCH = 50 ,                       # Minimum pitch value
    MAX_PITCH = 800 ,                      # Maximum pitch value
    CREPE_HOP_LENGTH = 128 ,               # Hop length for Crepe
    INDEX_RATE = 1.0 ,                     # Index rate for model inference
    FILTER_RADIUS = 3 ,                    # Radius for smoothing filters
    RMS_MIX_RATE = 0.75 ,                  # Mixing rate for RMS
    PROTECT = 0.33 ,                       # Protect level to prevent overfitting
    SPLIT_INFER = True ,                   # Whether to split audio for inference
    MIN_SILENCE = 0.5 ,                    # Minimum silence duration for splitting
    SILENCE_THRESHOLD = - 40 ,              # Silence threshold in dB
    SEEK_STEP = 10 ,                       # Seek step in milliseconds
    KEEP_SILENCE = 0.1 ,                   # Keep silence duration in seconds
    QUEFRENCY = 0.0 ,                      # Cepstrum quefrency adjustment
    TIMBRE = 1.0 ,                         # Timbre preservation level
    F0_AUTOTUNE = False ,                  # Enable or disable F0 autotuning
    OUTPUT_FORMAT = "wav"                 # Desired output format (e.g., "wav", "mp3")
)

La fonction infer_audio renvoie l'objet audio traité en fonction des paramètres fournis

Vous pouvez également utiliser ce nouveau mode d'inférence

 from rvc_inferpy import infernew


infer = infernew(
    model_name="model_name_here",
    sound_path="path_to_audio.wav",
    f0_change=0
)

output_audio = infer.run_inference()
print("Inference completed:", output_audio)

Télécharger des modèles

Vous pouvez également télécharger vos propres modèles RVC en utilisant


from rvc_inferpy import download_rvc_model dlrvc

dlrvc("URL_HERE", "model_name")

Note

Les modèles Downloas n'ont permis que des liens Huggingface, Google Drive, and Pixeldrain .

Conseil

Assurez-vous de télécharger vos modèles dans le dossier models/{model_name} .

Conditions d'utilisation

L'utilisation de la voix convertie aux fins suivantes est interdite.

Critiquer ou attaquer des individus.
Plaider ou s'opposer à des positions politiques spécifiques, des religions ou des idéologies.
Affichant publiquement des expressions fortement stimulantes sans zonage approprié.
Vente de modèles vocaux et clips vocaux générés.
Une imitation du propriétaire d'origine de la voix avec des intentions malveillantes de nuire / blesser les autres.
Des objectifs frauduleux qui conduisent à un vol d'identité ou à des appels téléphoniques frauduleux.

Clause de non-responsabilité

Je ne suis pas responsable des dommages directs, indirects, conséquents, accessoires ou spéciaux résultant de ou de quelque manière que ce soit lié à l'utilisation / abus ou à l'incapacité d'utiliser ce logiciel.