Note
Ce projet est toujours en cours de développement.
rvc_inferpy est une bibliothèque Python pour effectuer une inférence audio avec RVC (conversion vocale basée sur la récupération). Il fournit une interface de ligne de commande simple (CLI) et peut être intégré dans des projets Python pour le traitement audio avec des paramètres personnalisables.
Vous pouvez installer le package à l'aide de pip :
pip install rvc-inferpy Vous pouvez interagir avec rvc_inferpy via la ligne de commande. Pour afficher les options disponibles et comment utiliser l'outil, exécutez:
rvc-cli -hVoici une ventilation des options de ligne de commande complètes:
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : montrez le message d'aide et la sortie.--model_name MODEL_NAME : nom ou chemin du modèle.--audio_path AUDIO_PATH : Chemin vers le fichier audio d'entrée.--f0_change F0_CHANGE : facteur de changement de hauteur.--f0_method F0_METHOD : Méthode pour l'estimation F0 (par exemple, "crêpe").--min_pitch MIN_PITCH : valeur de tangage minimale.--max_pitch MAX_PITCH : valeur de tangage maximale.--crepe_hop_length CREPE_HOP_LENGTH : longueur de houblon de crêpe.--index_rate INDEX_RATE : taux d'index.--filter_radius FILTER_RADIUS : rayon de filtre.--rms_mix_rate RMS_MIX_RATE : RMS MIX TAX.--protect PROTECT : Protect Facteur pour éviter la distorsion.--split_infer : activer l'inférence divisée.--min_silence MIN_SILENCE : Durée de silence minimale (en secondes).--silence_threshold SILENCE_THRESHOLD : Seuil Silence dans DB.--seek_step SEEK_STEP : taille étape pour la détection du silence.--keep_silence KEEP_SILENCE : durée pour garder le silence (en secondes).--do_formant : activer le traitement du formant.--quefrency QUEFRENCY : Réglage de Quefrenncy.--timbre TIMBRE : facteur de réglage du timbre.--f0_autotune : Activer le réglage automatique F0.--audio_format AUDIO_FORMAT : Format audio de sortie souhaité (par exemple, "wav", "mp3").--resample_sr RESAMPLE_SR : Resampon la fréquence d'échantillonnage.rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 Vous pouvez également utiliser rvc_inferpy directement dans vos projets Python. Voici un exemple:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) La fonction infer_audio renvoie l'objet audio traité en fonction des paramètres fournis
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
Vous pouvez également télécharger vos propres modèles RVC en utilisant
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
Note
Les modèles Downloas n'ont permis que des liens Huggingface, Google Drive, and Pixeldrain .
Conseil
Assurez-vous de télécharger vos modèles dans le dossier models/{model_name} .
L'utilisation de la voix convertie aux fins suivantes est interdite.
Critiquer ou attaquer des individus.
Plaider ou s'opposer à des positions politiques spécifiques, des religions ou des idéologies.
Affichant publiquement des expressions fortement stimulantes sans zonage approprié.
Vente de modèles vocaux et clips vocaux générés.
Une imitation du propriétaire d'origine de la voix avec des intentions malveillantes de nuire / blesser les autres.
Des objectifs frauduleux qui conduisent à un vol d'identité ou à des appels téléphoniques frauduleux.
Je ne suis pas responsable des dommages directs, indirects, conséquents, accessoires ou spéciaux résultant de ou de quelque manière que ce soit lié à l'utilisation / abus ou à l'incapacité d'utiliser ce logiciel.
Ce projet est autorisé sous la licence du MIT.