ดาวน์โหลด rvc_inferpy - rvc_inferpy ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

rvc_inferpy

โค้ดแหล่งที่มา AI

v0.5.7-beta

ดาวน์โหลด

RVC Inferpy

บันทึก

โครงการนี้ยังอยู่ระหว่างการพัฒนา ..

rvc_inferpy เป็นไลบรารี Python สำหรับการอนุมานเสียงด้วย RVC (การแปลงด้วยเสียงแบบดึงข้อมูล) มันมีอินเทอร์เฟซบรรทัดคำสั่งง่ายๆ (CLI) และสามารถรวมเข้ากับโครงการ Python สำหรับการประมวลผลเสียงด้วยพารามิเตอร์ที่ปรับแต่งได้

การติดตั้ง

คุณสามารถติดตั้งแพ็คเกจโดยใช้ pip :

pip install rvc-inferpy

การใช้งาน

อินเตอร์เฟสบรรทัดคำสั่ง (CLI)

คุณสามารถโต้ตอบกับ rvc_inferpy ผ่านบรรทัดคำสั่ง หากต้องการดูตัวเลือกที่มีอยู่และวิธีการใช้เครื่องมือ Run:

rvc-cli -h

นี่คือรายละเอียดของตัวเลือกบรรทัดคำสั่งเต็มรูปแบบ:

usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH] 
                 [--f0_change F0_CHANGE] [--f0_method F0_METHOD] 
                 [--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH] 
                 [--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE] 
                 [--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE] 
                 [--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE] 
                 [--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP] 
                 [--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY] 
                 [--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT] 
                 [--resample_sr RESAMPLE_SR]

ตัวเลือกบรรทัดคำสั่ง:

-h, --help : แสดงข้อความช่วยเหลือและออก
--model_name MODEL_NAME : ชื่อหรือเส้นทางของโมเดล
--audio_path AUDIO_PATH : พา ธ ไปยังไฟล์เสียงอินพุต
--f0_change F0_CHANGE : ปัจจัยการเปลี่ยนแปลงระดับเสียง
--f0_method F0_METHOD : วิธีการประมาณ F0 (เช่น "crepe")
--min_pitch MIN_PITCH : ค่าพิทช์ขั้นต่ำ
--max_pitch MAX_PITCH : ค่าพิทช์สูงสุด
--crepe_hop_length CREPE_HOP_LENGTH : ความยาว Hop Crepe
--index_rate INDEX_RATE : อัตราดัชนี
--filter_radius FILTER_RADIUS : รัศมีตัวกรอง
--rms_mix_rate RMS_MIX_RATE : อัตราผสม RMS
--protect PROTECT : ปกป้องปัจจัยเพื่อหลีกเลี่ยงการบิดเบือน
--split_infer : เปิดใช้งานการอนุมานแยก
--min_silence MIN_SILENCE : ระยะเวลาความเงียบขั้นต่ำ (เป็นวินาที)
--silence_threshold SILENCE_THRESHOLD : เกณฑ์ความเงียบใน DB
--seek_step SEEK_STEP : ขนาดขั้นตอนสำหรับการตรวจจับความเงียบ
--keep_silence KEEP_SILENCE : ระยะเวลาที่จะรักษาความเงียบ (ในไม่กี่วินาที)
--do_formant : เปิดใช้งานการประมวลผล formant
--quefrency QUEFRENCY : การปรับ quefrency
--timbre TIMBRE : ปัจจัยการปรับเสียงต่ำ
--f0_autotune : เปิดใช้งานการปรับแต่ง F0 อัตโนมัติ
--audio_format AUDIO_FORMAT : รูปแบบเสียงเอาท์พุทที่ต้องการ (เช่น "WAV", "MP3")
--resample_sr RESAMPLE_SR : อัตราตัวอย่างตัวอย่าง

ตัวอย่างคำสั่ง:

rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800

เป็นการพึ่งพาในโครงการ Python

คุณยังสามารถใช้ rvc_inferpy ได้โดยตรงในโครงการ Python ของคุณ นี่คือตัวอย่าง:

 from rvc_inferpy import infer_audio

inferred_audio = infer_audio (
    MODEL_NAME = "model_name_here" ,       # Name or path to the RVC model
    SOUND_PATH = "path_to_audio.wav" ,     # Path to the input audio file
    F0_CHANGE = 0 ,                        # Change in fundamental frequency
    F0_METHOD = "crepe" ,                  # F0 extraction method ("crepe", "dio", etc.)
    MIN_PITCH = 50 ,                       # Minimum pitch value
    MAX_PITCH = 800 ,                      # Maximum pitch value
    CREPE_HOP_LENGTH = 128 ,               # Hop length for Crepe
    INDEX_RATE = 1.0 ,                     # Index rate for model inference
    FILTER_RADIUS = 3 ,                    # Radius for smoothing filters
    RMS_MIX_RATE = 0.75 ,                  # Mixing rate for RMS
    PROTECT = 0.33 ,                       # Protect level to prevent overfitting
    SPLIT_INFER = True ,                   # Whether to split audio for inference
    MIN_SILENCE = 0.5 ,                    # Minimum silence duration for splitting
    SILENCE_THRESHOLD = - 40 ,              # Silence threshold in dB
    SEEK_STEP = 10 ,                       # Seek step in milliseconds
    KEEP_SILENCE = 0.1 ,                   # Keep silence duration in seconds
    QUEFRENCY = 0.0 ,                      # Cepstrum quefrency adjustment
    TIMBRE = 1.0 ,                         # Timbre preservation level
    F0_AUTOTUNE = False ,                  # Enable or disable F0 autotuning
    OUTPUT_FORMAT = "wav"                 # Desired output format (e.g., "wav", "mp3")
)

ฟังก์ชั่น infer_audio จะส่งคืนวัตถุเสียงที่ประมวลผลตามพารามิเตอร์ที่ให้ไว้

คุณยังสามารถใช้โหมดการอนุมานใหม่นี้ได้

 from rvc_inferpy import infernew


infer = infernew(
    model_name="model_name_here",
    sound_path="path_to_audio.wav",
    f0_change=0
)

output_audio = infer.run_inference()
print("Inference completed:", output_audio)

ดาวน์โหลดรุ่น

คุณสามารถดาวน์โหลดรุ่น RVC ของคุณเองโดยใช้


from rvc_inferpy import download_rvc_model dlrvc

dlrvc("URL_HERE", "model_name")

บันทึก

โมเดล Downloas อนุญาตให้ Huggingface, Google Drive, and Pixeldrain ลิงก์เท่านั้น

เคล็ดลับ

ตรวจสอบให้แน่ใจว่าคุณอัปโหลดโมเดลของคุณในโฟลเดอร์ models/{model_name}

ข้อกำหนดการใช้งาน

ห้ามใช้เสียงที่แปลงแล้วเพื่อจุดประสงค์ต่อไปนี้

วิพากษ์วิจารณ์หรือโจมตีบุคคล
การสนับสนุนหรือคัดค้านตำแหน่งทางการเมืองศาสนาหรืออุดมการณ์ที่เฉพาะเจาะจง
แสดงการแสดงออกที่กระตุ้นอย่างมากต่อสาธารณะโดยไม่ต้องแบ่งเขตที่เหมาะสม
การขายโมเดลเสียงและคลิปเสียงที่สร้างขึ้น
การแอบอ้างตัวตนของเจ้าของเสียงดั้งเดิมด้วยความตั้งใจที่เป็นอันตรายที่จะทำร้าย/ทำร้ายผู้อื่น
วัตถุประสงค์ในการฉ้อโกงที่นำไปสู่การขโมยข้อมูลประจำตัวหรือโทรศัพท์ที่ฉ้อโกง

คำเตือน

ฉันไม่รับผิดชอบต่อความเสียหายทางตรงทางอ้อมผลสืบเนื่องหรือความเสียหายพิเศษที่เกิดขึ้นจากหรือในทางที่เชื่อมต่อกับการใช้/การใช้งานในทางที่ผิดหรือไม่สามารถใช้ซอฟต์แวร์นี้ได้