Notiz
Dieses Projekt ist noch in der Entwicklung.
rvc_inferpy ist eine Python-Bibliothek zur Durchführung von Audio-Inferenz mit RVC (Abrufbasis-Sprachumwandlung). Es bietet eine einfache Befehlszeilenschnittstelle (CLI) und kann in Python-Projekte für die Audioverarbeitung mit anpassbaren Parametern integriert werden.
Sie können das Paket mit pip installieren:
pip install rvc-inferpy Sie können mit rvc_inferpy über die Befehlszeile interagieren. Um die verfügbaren Optionen und die Verwendung des Tools anzuzeigen, rennen Sie:
rvc-cli -hHier ist eine Aufschlüsselung der vollständigen Befehlszeilenoptionen:
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : Hilfsnachricht anzeigen und beenden.--model_name MODEL_NAME : Name oder Pfad des Modells.--audio_path AUDIO_PATH : Pfad zur Eingabe-Audio-Datei.--f0_change F0_CHANGE : Pitch Change-Faktor.--f0_method F0_METHOD : Methode für die F0-Schätzung (z. B. "Crepe").--min_pitch MIN_PITCH : Minimum Pitchwert.--max_pitch MAX_PITCH : Maximaler Tonhöhenwert.--crepe_hop_length CREPE_HOP_LENGTH : crepe hop länge.--index_rate INDEX_RATE : Indexrate.--filter_radius FILTER_RADIUS : Filterradius.--rms_mix_rate RMS_MIX_RATE : rms mix rate.--protect PROTECT : Protect Faktor, um Verzerrungen zu vermeiden.--split_infer : Aktivieren Sie die geteilte Inferenz.--min_silence MIN_SILENCE : Mindestdauer der Stille (in Sekunden).--silence_threshold SILENCE_THRESHOLD : Schweigenschwelle in db.--seek_step SEEK_STEP : Schrittgröße für die Stillekennung.--keep_silence KEEP_SILENCE : Dauer, um das Schweigen zu halten (in Sekunden).--do_formant : formantenverarbeitung aktivieren.--quefrency QUEFRENCY .--timbre TIMBRE : Timbre-Einstellfaktor.--f0_autotune : Aktivieren Sie die automatische F0-Abstimmung.--audio_format AUDIO_FORMAT : gewünschtes Ausgabe-Audioformat (z. B. "WAV", "MP3").--resample_sr RESAMPLE_SR : Beispielrate erneut.rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 Sie können auch rvc_inferpy direkt in Ihren Python -Projekten verwenden. Hier ist ein Beispiel:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) Die Funktion infer_audio gibt das verarbeitete Audioobjekt basierend auf den bereitgestellten Parametern zurück
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
Sie können auch Ihre eigenen RVC -Modelle mithilfe von verwenden
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
Notiz
Downloas -Modelle ermöglichten nur Links von Huggingface, Google Drive, and Pixeldrain .
Tipp
Stellen Sie sicher, dass Sie Ihre Modelle in den Ordner models/{model_name} hochladen.
Die Verwendung der konvertierten Stimme für folgende Zwecke ist verboten.
Personen kritisieren oder angreifen.
Sich für bestimmte politische Positionen, Religionen oder Ideologien einsetzen oder sich entgegensetzen.
Öffentlich stark stimulierende Ausdrücke ohne ordnungsgemäße Zonierung aufzeigen.
Verkauf von Sprachmodellen und generierten Sprachclips.
Imitation des ursprünglichen Besitzers der Stimme mit böswilligen Absichten, andere zu schaden/zu verletzen.
Betrügerische Zwecke, die zu Identitätsdiebstahl oder betrügerischen Telefonanrufen führen.
Ich haftet nicht für direkte, indirekte, konsequente, zufällige oder besondere Schäden, die sich aus oder in irgendeiner Weise mit der Verwendung/dem Missbrauch oder der Unfähigkeit, diese Software zu verwenden, auftreten.
Dieses Projekt ist unter der MIT -Lizenz lizenziert.