บันทึก
โครงการนี้ยังอยู่ระหว่างการพัฒนา ..
rvc_inferpy เป็นไลบรารี Python สำหรับการอนุมานเสียงด้วย RVC (การแปลงด้วยเสียงแบบดึงข้อมูล) มันมีอินเทอร์เฟซบรรทัดคำสั่งง่ายๆ (CLI) และสามารถรวมเข้ากับโครงการ Python สำหรับการประมวลผลเสียงด้วยพารามิเตอร์ที่ปรับแต่งได้
คุณสามารถติดตั้งแพ็คเกจโดยใช้ pip :
pip install rvc-inferpy คุณสามารถโต้ตอบกับ rvc_inferpy ผ่านบรรทัดคำสั่ง หากต้องการดูตัวเลือกที่มีอยู่และวิธีการใช้เครื่องมือ Run:
rvc-cli -hนี่คือรายละเอียดของตัวเลือกบรรทัดคำสั่งเต็มรูปแบบ:
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : แสดงข้อความช่วยเหลือและออก--model_name MODEL_NAME : ชื่อหรือเส้นทางของโมเดล--audio_path AUDIO_PATH : พา ธ ไปยังไฟล์เสียงอินพุต--f0_change F0_CHANGE : ปัจจัยการเปลี่ยนแปลงระดับเสียง--f0_method F0_METHOD : วิธีการประมาณ F0 (เช่น "crepe")--min_pitch MIN_PITCH : ค่าพิทช์ขั้นต่ำ--max_pitch MAX_PITCH : ค่าพิทช์สูงสุด--crepe_hop_length CREPE_HOP_LENGTH : ความยาว Hop Crepe--index_rate INDEX_RATE : อัตราดัชนี--filter_radius FILTER_RADIUS : รัศมีตัวกรอง--rms_mix_rate RMS_MIX_RATE : อัตราผสม RMS--protect PROTECT : ปกป้องปัจจัยเพื่อหลีกเลี่ยงการบิดเบือน--split_infer : เปิดใช้งานการอนุมานแยก--min_silence MIN_SILENCE : ระยะเวลาความเงียบขั้นต่ำ (เป็นวินาที)--silence_threshold SILENCE_THRESHOLD : เกณฑ์ความเงียบใน DB--seek_step SEEK_STEP : ขนาดขั้นตอนสำหรับการตรวจจับความเงียบ--keep_silence KEEP_SILENCE : ระยะเวลาที่จะรักษาความเงียบ (ในไม่กี่วินาที)--do_formant : เปิดใช้งานการประมวลผล formant--quefrency QUEFRENCY : การปรับ quefrency--timbre TIMBRE : ปัจจัยการปรับเสียงต่ำ--f0_autotune : เปิดใช้งานการปรับแต่ง F0 อัตโนมัติ--audio_format AUDIO_FORMAT : รูปแบบเสียงเอาท์พุทที่ต้องการ (เช่น "WAV", "MP3")--resample_sr RESAMPLE_SR : อัตราตัวอย่างตัวอย่างrvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 คุณยังสามารถใช้ rvc_inferpy ได้โดยตรงในโครงการ Python ของคุณ นี่คือตัวอย่าง:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) ฟังก์ชั่น infer_audio จะส่งคืนวัตถุเสียงที่ประมวลผลตามพารามิเตอร์ที่ให้ไว้
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
คุณสามารถดาวน์โหลดรุ่น RVC ของคุณเองโดยใช้
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
บันทึก
โมเดล Downloas อนุญาตให้ Huggingface, Google Drive, and Pixeldrain ลิงก์เท่านั้น
เคล็ดลับ
ตรวจสอบให้แน่ใจว่าคุณอัปโหลดโมเดลของคุณในโฟลเดอร์ models/{model_name}
ห้ามใช้เสียงที่แปลงแล้วเพื่อจุดประสงค์ต่อไปนี้
วิพากษ์วิจารณ์หรือโจมตีบุคคล
การสนับสนุนหรือคัดค้านตำแหน่งทางการเมืองศาสนาหรืออุดมการณ์ที่เฉพาะเจาะจง
แสดงการแสดงออกที่กระตุ้นอย่างมากต่อสาธารณะโดยไม่ต้องแบ่งเขตที่เหมาะสม
การขายโมเดลเสียงและคลิปเสียงที่สร้างขึ้น
การแอบอ้างตัวตนของเจ้าของเสียงดั้งเดิมด้วยความตั้งใจที่เป็นอันตรายที่จะทำร้าย/ทำร้ายผู้อื่น
วัตถุประสงค์ในการฉ้อโกงที่นำไปสู่การขโมยข้อมูลประจำตัวหรือโทรศัพท์ที่ฉ้อโกง
ฉันไม่รับผิดชอบต่อความเสียหายทางตรงทางอ้อมผลสืบเนื่องหรือความเสียหายพิเศษที่เกิดขึ้นจากหรือในทางที่เชื่อมต่อกับการใช้/การใช้งานในทางที่ผิดหรือไม่สามารถใช้ซอฟต์แวร์นี้ได้
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT