Catatan
Proyek ini masih sedang dikembangkan ..
rvc_inferpy adalah perpustakaan Python untuk melakukan inferensi audio dengan RVC (konversi suara berbasis pengambilan). Ini menyediakan antarmuka baris perintah sederhana (CLI) dan dapat diintegrasikan ke dalam proyek Python untuk pemrosesan audio dengan parameter yang dapat disesuaikan.
Anda dapat menginstal paket menggunakan pip :
pip install rvc-inferpy Anda dapat berinteraksi dengan rvc_inferpy melalui baris perintah. Untuk melihat opsi yang tersedia dan cara menggunakan alat ini, jalankan:
rvc-cli -hBerikut adalah rincian opsi baris perintah lengkap:
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : Tampilkan pesan bantuan dan keluar.--model_name MODEL_NAME : Nama atau jalur model.--audio_path AUDIO_PATH : Path ke file audio input.--f0_change F0_CHANGE : Pitch Change Factor.--f0_method F0_METHOD : Metode untuk estimasi f0 (misalnya, "crepe").--min_pitch MIN_PITCH : Nilai pitch minimum.--max_pitch MAX_PITCH : Nilai pitch maksimum.--crepe_hop_length CREPE_HOP_LENGTH : crepe hop length.--index_rate INDEX_RATE : Tingkat indeks.--filter_radius FILTER_RADIUS : filter radius.--rms_mix_rate RMS_MIX_RATE : RMS Mix Rate.--protect PROTECT : Lindungi faktor untuk menghindari distorsi.--split_infer : Aktifkan inferensi split.--min_silence MIN_SILENCE : Durasi keheningan minimum (dalam detik).--silence_threshold SILENCE_THRESHOLD : Silence Threshold di DB.--seek_step SEEK_STEP : Ukuran langkah untuk deteksi keheningan.--keep_silence KEEP_SILENCE : Durasi untuk tetap diam (dalam detik).--do_formant : Aktifkan pemrosesan formant.--quefrency QUEFRENCY : Penyesuaian quefrency.--timbre TIMBRE : Faktor Penyesuaian Timbre.--f0_autotune : Aktifkan penyetelan F0 otomatis.--audio_format AUDIO_FORMAT : Format audio output yang diinginkan (misalnya, "wav", "mp3").--resample_sr RESAMPLE_SR : laju sampel resample.rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 Anda juga dapat menggunakan rvc_inferpy langsung di proyek Python Anda. Inilah contohnya:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) Fungsi infer_audio akan mengembalikan objek audio yang diproses berdasarkan parameter yang disediakan
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
Anda juga dapat mengunduh model RVC Anda sendiri menggunakan
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
Catatan
Model downloas hanya memungkinkan tautan Huggingface, Google Drive, and Pixeldrain .
Tip
Pastikan Anda mengunggah model Anda di folder models/{model_name} .
Penggunaan suara yang dikonversi untuk tujuan berikut dilarang.
Mengkritik atau menyerang individu.
Mengadvokasi atau menentang posisi politik spesifik, agama, atau ideologi.
Secara publik menampilkan ekspresi yang sangat merangsang tanpa zonasi yang tepat.
Penjualan model suara dan klip suara yang dihasilkan.
Peniruan pemilik asli suara dengan niat jahat untuk membahayakan/melukai orang lain.
Tujuan penipuan yang mengarah pada pencurian identitas atau panggilan telepon yang curang.
Saya tidak bertanggung jawab atas kerusakan langsung, tidak langsung, konsekuensial, insidental, atau khusus yang timbul dari atau dengan cara apa pun yang terhubung dengan penggunaan/penyalahgunaan atau ketidakmampuan untuk menggunakan perangkat lunak ini.
Proyek ini dilisensikan di bawah lisensi MIT.