메모
이 프로젝트는 여전히 개발 중입니다 ..
rvc_inferpy RVC (검색 기반 음성 변환)와의 오디오 추론을 수행하기위한 파이썬 라이브러리입니다. 간단한 명령 줄 인터페이스 (CLI)를 제공하며 사용자 정의 가능한 매개 변수로 오디오 처리를 위해 Python 프로젝트에 통합 될 수 있습니다.
pip 사용하여 패키지를 설치할 수 있습니다.
pip install rvc-inferpy 명령 줄을 통해 rvc_inferpy 와 상호 작용할 수 있습니다. 사용 가능한 옵션과 도구 사용 방법을 보려면 실행하십시오.
rvc-cli -h다음은 전체 명령 줄 옵션의 분석입니다.
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : 도움말 메시지와 종료.--model_name MODEL_NAME : 모델의 이름 또는 경로.--audio_path AUDIO_PATH : 입력 오디오 파일로가는 경로.--f0_change F0_CHANGE : 피치 변화 계수.--f0_method F0_METHOD : F0 추정 방법 (예 : "Crepe").--min_pitch MIN_PITCH : 최소 피치 값.--max_pitch MAX_PITCH : 최대 피치 값.--crepe_hop_length CREPE_HOP_LENGTH : crepe 홉 길이.--index_rate INDEX_RATE : 인덱스 속도.--filter_radius FILTER_RADIUS : 필터 반경.--rms_mix_rate RMS_MIX_RATE : rms 믹스 속도.--protect PROTECT : 왜곡을 피하기위한 요소.--split_infer : 분할을 활성화합니다.--min_silence MIN_SILENCE : 최소 침묵 지속 시간 (초).--silence_threshold SILENCE_THRESHOLD : db의 침묵 임계 값.--seek_step SEEK_STEP : 침묵 감지를위한 단계 크기.--keep_silence KEEP_SILENCE : 침묵을 유지하는 시간 (초).--do_formant : 공식 처리를 활성화합니다.--quefrency QUEFRENCY : Quefrency 조정.--timbre TIMBRE : 음색 조정 계수.--f0_autotune : 자동 F0 튜닝을 활성화합니다.--audio_format AUDIO_FORMAT : 원하는 출력 오디오 형식 (예 : "wav", "mp3").--resample_sr RESAMPLE_SR : 샘플 샘플 속도.rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 파이썬 프로젝트에서 직접 rvc_inferpy 사용할 수도 있습니다. 예는 다음과 같습니다.
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) infer_audio 함수는 제공된 매개 변수를 기반으로 처리 된 오디오 객체를 반환합니다.
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
또한 자신의 RVC 모델을 사용하여 다운로드 할 수도 있습니다
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
메모
Downloas 모델은 Huggingface, Google Drive, and Pixeldrain 링크 만 허용했습니다.
팁
models/{model_name} 폴더에 모델을 업로드해야합니다.
다음 목적으로 변환 된 음성의 사용은 금지됩니다.
개인을 비판하거나 공격합니다.
특정 정치적 지위, 종교 또는 이데올로기를 옹호하거나 반대하는 것.
적절한 구역 설정없이 강력하게 자극적 인 표현을 공개적으로 표시합니다.
음성 모델 판매 및 생성 된 음성 클립.
다른 사람들을 해치거나 상처하려는 악의적 인 의도로 목소리의 원래 소유자를 가장합니다.
신원 도용 또는 사기 전화 통화로 이어지는 사기 목적.
본인은 사용/오용 또는이 소프트웨어를 사용할 수없는 방식으로 또는 어떤 방식 으로든 발생하는 직접, 간접적, 결과적, 부수적 또는 특별한 손해에 대해 책임을지지 않습니다.
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다.