rvc_inferpy Download - rvc_inferpy CODE SUMBER Unduh

rvc_inferpy

Kode Sumber AI

v0.5.7-beta

Unduh

RVC Inferpy

Catatan

Proyek ini masih sedang dikembangkan ..

rvc_inferpy adalah perpustakaan Python untuk melakukan inferensi audio dengan RVC (konversi suara berbasis pengambilan). Ini menyediakan antarmuka baris perintah sederhana (CLI) dan dapat diintegrasikan ke dalam proyek Python untuk pemrosesan audio dengan parameter yang dapat disesuaikan.

Instalasi

Anda dapat menginstal paket menggunakan pip :

pip install rvc-inferpy

Penggunaan

Antarmuka baris perintah (CLI)

Anda dapat berinteraksi dengan rvc_inferpy melalui baris perintah. Untuk melihat opsi yang tersedia dan cara menggunakan alat ini, jalankan:

rvc-cli -h

Berikut adalah rincian opsi baris perintah lengkap:

usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH] 
                 [--f0_change F0_CHANGE] [--f0_method F0_METHOD] 
                 [--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH] 
                 [--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE] 
                 [--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE] 
                 [--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE] 
                 [--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP] 
                 [--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY] 
                 [--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT] 
                 [--resample_sr RESAMPLE_SR]

Opsi baris perintah:

-h, --help : Tampilkan pesan bantuan dan keluar.
--model_name MODEL_NAME : Nama atau jalur model.
--audio_path AUDIO_PATH : Path ke file audio input.
--f0_change F0_CHANGE : Pitch Change Factor.
--f0_method F0_METHOD : Metode untuk estimasi f0 (misalnya, "crepe").
--min_pitch MIN_PITCH : Nilai pitch minimum.
--max_pitch MAX_PITCH : Nilai pitch maksimum.
--crepe_hop_length CREPE_HOP_LENGTH : crepe hop length.
--index_rate INDEX_RATE : Tingkat indeks.
--filter_radius FILTER_RADIUS : filter radius.
--rms_mix_rate RMS_MIX_RATE : RMS Mix Rate.
--protect PROTECT : Lindungi faktor untuk menghindari distorsi.
--split_infer : Aktifkan inferensi split.
--min_silence MIN_SILENCE : Durasi keheningan minimum (dalam detik).
--silence_threshold SILENCE_THRESHOLD : Silence Threshold di DB.
--seek_step SEEK_STEP : Ukuran langkah untuk deteksi keheningan.
--keep_silence KEEP_SILENCE : Durasi untuk tetap diam (dalam detik).
--do_formant : Aktifkan pemrosesan formant.
--quefrency QUEFRENCY : Penyesuaian quefrency.
--timbre TIMBRE : Faktor Penyesuaian Timbre.
--f0_autotune : Aktifkan penyetelan F0 otomatis.
--audio_format AUDIO_FORMAT : Format audio output yang diinginkan (misalnya, "wav", "mp3").
--resample_sr RESAMPLE_SR : laju sampel resample.

Contoh Perintah:

rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800

Sebagai ketergantungan dalam proyek Python

Anda juga dapat menggunakan rvc_inferpy langsung di proyek Python Anda. Inilah contohnya:

 from rvc_inferpy import infer_audio

inferred_audio = infer_audio (
    MODEL_NAME = "model_name_here" ,       # Name or path to the RVC model
    SOUND_PATH = "path_to_audio.wav" ,     # Path to the input audio file
    F0_CHANGE = 0 ,                        # Change in fundamental frequency
    F0_METHOD = "crepe" ,                  # F0 extraction method ("crepe", "dio", etc.)
    MIN_PITCH = 50 ,                       # Minimum pitch value
    MAX_PITCH = 800 ,                      # Maximum pitch value
    CREPE_HOP_LENGTH = 128 ,               # Hop length for Crepe
    INDEX_RATE = 1.0 ,                     # Index rate for model inference
    FILTER_RADIUS = 3 ,                    # Radius for smoothing filters
    RMS_MIX_RATE = 0.75 ,                  # Mixing rate for RMS
    PROTECT = 0.33 ,                       # Protect level to prevent overfitting
    SPLIT_INFER = True ,                   # Whether to split audio for inference
    MIN_SILENCE = 0.5 ,                    # Minimum silence duration for splitting
    SILENCE_THRESHOLD = - 40 ,              # Silence threshold in dB
    SEEK_STEP = 10 ,                       # Seek step in milliseconds
    KEEP_SILENCE = 0.1 ,                   # Keep silence duration in seconds
    QUEFRENCY = 0.0 ,                      # Cepstrum quefrency adjustment
    TIMBRE = 1.0 ,                         # Timbre preservation level
    F0_AUTOTUNE = False ,                  # Enable or disable F0 autotuning
    OUTPUT_FORMAT = "wav"                 # Desired output format (e.g., "wav", "mp3")
)

Fungsi infer_audio akan mengembalikan objek audio yang diproses berdasarkan parameter yang disediakan

Anda juga dapat menggunakan mode inferensi baru ini

 from rvc_inferpy import infernew


infer = infernew(
    model_name="model_name_here",
    sound_path="path_to_audio.wav",
    f0_change=0
)

output_audio = infer.run_inference()
print("Inference completed:", output_audio)

Unduh model

Anda juga dapat mengunduh model RVC Anda sendiri menggunakan


from rvc_inferpy import download_rvc_model dlrvc

dlrvc("URL_HERE", "model_name")

Catatan

Model downloas hanya memungkinkan tautan Huggingface, Google Drive, and Pixeldrain .

Tip

Pastikan Anda mengunggah model Anda di folder models/{model_name} .

Ketentuan Penggunaan

Penggunaan suara yang dikonversi untuk tujuan berikut dilarang.

Mengkritik atau menyerang individu.
Mengadvokasi atau menentang posisi politik spesifik, agama, atau ideologi.
Secara publik menampilkan ekspresi yang sangat merangsang tanpa zonasi yang tepat.
Penjualan model suara dan klip suara yang dihasilkan.
Peniruan pemilik asli suara dengan niat jahat untuk membahayakan/melukai orang lain.
Tujuan penipuan yang mengarah pada pencurian identitas atau panggilan telepon yang curang.

Penafian

Saya tidak bertanggung jawab atas kerusakan langsung, tidak langsung, konsekuensial, insidental, atau khusus yang timbul dari atau dengan cara apa pun yang terhubung dengan penggunaan/penyalahgunaan atau ketidakmampuan untuk menggunakan perangkat lunak ini.