rvc_inferpy download - rvc_inferpy Source Code Download

rvc_inferpy

AI-Quellcode

v0.5.7-beta

Herunterladen

RVC inferpy

Notiz

Dieses Projekt ist noch in der Entwicklung.

rvc_inferpy ist eine Python-Bibliothek zur Durchführung von Audio-Inferenz mit RVC (Abrufbasis-Sprachumwandlung). Es bietet eine einfache Befehlszeilenschnittstelle (CLI) und kann in Python-Projekte für die Audioverarbeitung mit anpassbaren Parametern integriert werden.

Installation

Sie können das Paket mit pip installieren:

pip install rvc-inferpy

Verwendung

Befehlszeilenschnittstelle (CLI)

Sie können mit rvc_inferpy über die Befehlszeile interagieren. Um die verfügbaren Optionen und die Verwendung des Tools anzuzeigen, rennen Sie:

rvc-cli -h

Hier ist eine Aufschlüsselung der vollständigen Befehlszeilenoptionen:

usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH] 
                 [--f0_change F0_CHANGE] [--f0_method F0_METHOD] 
                 [--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH] 
                 [--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE] 
                 [--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE] 
                 [--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE] 
                 [--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP] 
                 [--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY] 
                 [--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT] 
                 [--resample_sr RESAMPLE_SR]

Befehlszeilenoptionen:

-h, --help : Hilfsnachricht anzeigen und beenden.
--model_name MODEL_NAME : Name oder Pfad des Modells.
--audio_path AUDIO_PATH : Pfad zur Eingabe-Audio-Datei.
--f0_change F0_CHANGE : Pitch Change-Faktor.
--f0_method F0_METHOD : Methode für die F0-Schätzung (z. B. "Crepe").
--min_pitch MIN_PITCH : Minimum Pitchwert.
--max_pitch MAX_PITCH : Maximaler Tonhöhenwert.
--crepe_hop_length CREPE_HOP_LENGTH : crepe hop länge.
--index_rate INDEX_RATE : Indexrate.
--filter_radius FILTER_RADIUS : Filterradius.
--rms_mix_rate RMS_MIX_RATE : rms mix rate.
--protect PROTECT : Protect Faktor, um Verzerrungen zu vermeiden.
--split_infer : Aktivieren Sie die geteilte Inferenz.
--min_silence MIN_SILENCE : Mindestdauer der Stille (in Sekunden).
--silence_threshold SILENCE_THRESHOLD : Schweigenschwelle in db.
--seek_step SEEK_STEP : Schrittgröße für die Stillekennung.
--keep_silence KEEP_SILENCE : Dauer, um das Schweigen zu halten (in Sekunden).
--do_formant : formantenverarbeitung aktivieren.
--quefrency QUEFRENCY .
--timbre TIMBRE : Timbre-Einstellfaktor.
--f0_autotune : Aktivieren Sie die automatische F0-Abstimmung.
--audio_format AUDIO_FORMAT : gewünschtes Ausgabe-Audioformat (z. B. "WAV", "MP3").
--resample_sr RESAMPLE_SR : Beispielrate erneut.

Beispielbefehl:

rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800

Als Abhängigkeit in einem Python -Projekt

Sie können auch rvc_inferpy direkt in Ihren Python -Projekten verwenden. Hier ist ein Beispiel:

 from rvc_inferpy import infer_audio

inferred_audio = infer_audio (
    MODEL_NAME = "model_name_here" ,       # Name or path to the RVC model
    SOUND_PATH = "path_to_audio.wav" ,     # Path to the input audio file
    F0_CHANGE = 0 ,                        # Change in fundamental frequency
    F0_METHOD = "crepe" ,                  # F0 extraction method ("crepe", "dio", etc.)
    MIN_PITCH = 50 ,                       # Minimum pitch value
    MAX_PITCH = 800 ,                      # Maximum pitch value
    CREPE_HOP_LENGTH = 128 ,               # Hop length for Crepe
    INDEX_RATE = 1.0 ,                     # Index rate for model inference
    FILTER_RADIUS = 3 ,                    # Radius for smoothing filters
    RMS_MIX_RATE = 0.75 ,                  # Mixing rate for RMS
    PROTECT = 0.33 ,                       # Protect level to prevent overfitting
    SPLIT_INFER = True ,                   # Whether to split audio for inference
    MIN_SILENCE = 0.5 ,                    # Minimum silence duration for splitting
    SILENCE_THRESHOLD = - 40 ,              # Silence threshold in dB
    SEEK_STEP = 10 ,                       # Seek step in milliseconds
    KEEP_SILENCE = 0.1 ,                   # Keep silence duration in seconds
    QUEFRENCY = 0.0 ,                      # Cepstrum quefrency adjustment
    TIMBRE = 1.0 ,                         # Timbre preservation level
    F0_AUTOTUNE = False ,                  # Enable or disable F0 autotuning
    OUTPUT_FORMAT = "wav"                 # Desired output format (e.g., "wav", "mp3")
)

Die Funktion infer_audio gibt das verarbeitete Audioobjekt basierend auf den bereitgestellten Parametern zurück

Sie können diesen neuen Inferenzmodus auch verwenden

 from rvc_inferpy import infernew


infer = infernew(
    model_name="model_name_here",
    sound_path="path_to_audio.wav",
    f0_change=0
)

output_audio = infer.run_inference()
print("Inference completed:", output_audio)

Herunterladen Modelle

Sie können auch Ihre eigenen RVC -Modelle mithilfe von verwenden


from rvc_inferpy import download_rvc_model dlrvc

dlrvc("URL_HERE", "model_name")

Notiz

Downloas -Modelle ermöglichten nur Links von Huggingface, Google Drive, and Pixeldrain .

Tipp

Stellen Sie sicher, dass Sie Ihre Modelle in den Ordner models/{model_name} hochladen.

Nutzungsbedingungen

Die Verwendung der konvertierten Stimme für folgende Zwecke ist verboten.

Personen kritisieren oder angreifen.
Sich für bestimmte politische Positionen, Religionen oder Ideologien einsetzen oder sich entgegensetzen.
Öffentlich stark stimulierende Ausdrücke ohne ordnungsgemäße Zonierung aufzeigen.
Verkauf von Sprachmodellen und generierten Sprachclips.
Imitation des ursprünglichen Besitzers der Stimme mit böswilligen Absichten, andere zu schaden/zu verletzen.
Betrügerische Zwecke, die zu Identitätsdiebstahl oder betrügerischen Telefonanrufen führen.

Haftungsausschluss

Ich haftet nicht für direkte, indirekte, konsequente, zufällige oder besondere Schäden, die sich aus oder in irgendeiner Weise mit der Verwendung/dem Missbrauch oder der Unfähigkeit, diese Software zu verwenden, auftreten.