Observação
Este projeto ainda está em desenvolvimento.
rvc_inferpy é uma biblioteca Python para realizar inferência de áudio com RVC (conversão de voz baseada em recuperação). Ele fornece uma interface simples da linha de comando (CLI) e pode ser integrada aos projetos Python para processamento de áudio com parâmetros personalizáveis.
Você pode instalar o pacote usando pip :
pip install rvc-inferpy Você pode interagir com rvc_inferpy através da linha de comando. Para visualizar as opções disponíveis e como usar a ferramenta, execute:
rvc-cli -hAqui está um detalhamento das opções completas da linha de comando:
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : mostre mensagem de ajuda e saída.--model_name MODEL_NAME : Nome ou caminho do modelo.--audio_path AUDIO_PATH : caminho para o arquivo de áudio de entrada.--f0_change F0_CHANGE : fator de mudança de afinação.--f0_method F0_METHOD : método para estimativa f0 (por exemplo, "crepe").--min_pitch MIN_PITCH : valor mínimo de afinação.--max_pitch MAX_PITCH : valor máximo de afinação.--crepe_hop_length CREPE_HOP_LENGTH : comprimento do salto crepe.--index_rate INDEX_RATE : taxa de índice.--filter_radius FILTER_RADIUS : Filtro raio.--rms_mix_rate RMS_MIX_RATE : rms mix taxa.--protect PROTECT : Protect Factor para evitar a distorção.--split_infer : Ative a inferência dividida.--min_silence MIN_SILENCE : duração mínima do silêncio (em segundos).--silence_threshold SILENCE_THRESHOLD : limiar de silêncio em db.--seek_step SEEK_STEP : Tamanho da etapa para detecção de silêncio.--keep_silence KEEP_SILENCE : duração para manter o silêncio (em segundos).--do_formant : Ative o processamento formante.--quefrency QUEFRENCY : Ajuste de Quefrency.--timbre TIMBRE : fator de ajuste do timbre.--f0_autotune : Ativar ajuste automático F0.--audio_format AUDIO_FORMAT : Formato de áudio de saída desejado (por exemplo, "wav", "mp3").--resample_sr RESAMPLE_SR : Remamamam a taxa de amostragem.rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 Você também pode usar rvc_inferpy diretamente em seus projetos Python. Aqui está um exemplo:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) A função infer_audio retornará o objeto de áudio processado com base nos parâmetros fornecidos
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
Você também pode baixar seus próprios modelos de RVC usando
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
Observação
Os modelos Downloas só permitiram Huggingface, Google Drive, and Pixeldrain .
Dica
Certifique -se de fazer upload de seus modelos na pasta models/{model_name} .
É proibido o uso da voz convertida para os seguintes propósitos.
Criticando ou atacando indivíduos.
Advogando ou opondo posições políticas específicas, religiões ou ideologias.
Exibindo publicamente expressões fortemente estimulantes sem o zoneamento adequado.
Venda de modelos de voz e clipes de voz gerados.
Representação do proprietário original da voz com intenções maliciosas de prejudicar/prejudicar os outros.
Fins fraudulentos que levam a roubo de identidade ou telefonemas fraudulentos.
Não sou responsável por nenhum dano direto, indireto, conseqüente, incidental ou especial decorrente de ou de qualquer forma relacionada ao uso/uso indevido ou incapacidade de usar este software.
Este projeto está licenciado sob a licença do MIT.