Примечание
Этот проект все еще находится в стадии разработки ..
rvc_inferpy -это библиотека Python для вывода аудио с RVC (конверсия голоса на основе поиска). Он предоставляет простой интерфейс командной строки (CLI) и может быть интегрирован в проекты Python для обработки аудио с настраиваемыми параметрами.
Вы можете установить пакет с помощью pip :
pip install rvc-inferpy Вы можете взаимодействовать с rvc_inferpy через командную строку. Чтобы просмотреть доступные параметры и как использовать инструмент, запустите:
rvc-cli -hВот разбивка полных параметров командной строки:
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help : Показать сообщение справки и выход.--model_name MODEL_NAME : имя или путь модели.--audio_path AUDIO_PATH : path to Input Audio File.--f0_change F0_CHANGE : Коэффициент изменения высоты.--f0_method F0_METHOD : Метод оценки F0 (например, "Crepe").--min_pitch MIN_PITCH : минимальное значение шага.--max_pitch MAX_PITCH : максимальное значение шага.--crepe_hop_length CREPE_HOP_LENGTH : длина крепа-хопа.--index_rate INDEX_RATE : индексная скорость.--filter_radius FILTER_RADIUS : радиус фильтра.--rms_mix_rate RMS_MIX_RATE : Скорость смеси RMS.--protect PROTECT : защитите фактор, чтобы избежать искажений.--split_infer : включить разделенный вывод.--min_silence MIN_SILENCE : минимальная продолжительность молчания (в секундах).--silence_threshold SILENCE_THRESHOLD : Порог молчания в дБ.--seek_step SEEK_STEP : размер шага для обнаружения молчания.--keep_silence KEEP_SILENCE : продолжительность, чтобы сохранить молчание (в считанные секунды).--do_formant : включить обработку форманта.--quefrency QUEFRENCY : корректировка Quefrency.--timbre TIMBRE : Timbre Factorment.--f0_autotune : включить автоматическую настройку F0.--audio_format AUDIO_FORMAT : желаемый аудио формат вывода (например, "wav", "mp3").--resample_sr RESAMPLE_SR : Resample Screed.rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800 Вы также можете использовать rvc_inferpy непосредственно в ваших проектах Python. Вот пример:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) Функция infer_audio вернет обработанный аудио -объект на основе предоставленных параметров
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
Вы также можете скачать свои собственные модели RVC, используя
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
Примечание
Модели DownLoas только разрешали ссылки Huggingface, Google Drive, and Pixeldrain .
Кончик
Убедитесь, что вы загружаете свои модели в папку models/{model_name} .
Использование конвертированного голоса для следующих целей запрещено.
Критикуя или нападая на людей.
Выступая за конкретные политические позиции, религии или идеологии.
Публично отображая сильно стимулирующие выражения без правильного зонирования.
Продажа голосовых моделей и сгенерированных голосовых клипов.
Выражение первоначального владельца голоса со злонамеренными намерениями причинить вред/навредить другим.
Мошеннические цели, которые приводят к краже личных данных или мошенническим телефонным звонкам.
Я не несет ответственности за какие -либо прямые, косвенные, косвенные, случайные или специальные убытки, возникающие из -за или каким -либо образом связаны с использованием/неправильным использованием или неспособностью использовать это программное обеспечение.
Этот проект лицензирован по лицензии MIT.