Скачать rvc_inferpy - rvc_inferpy исходный код скачать

rvc_inferpy

AI Исходный код

v0.5.7-beta

Скачать

RVC Inferpy

Примечание

Этот проект все еще находится в стадии разработки ..

rvc_inferpy -это библиотека Python для вывода аудио с RVC (конверсия голоса на основе поиска). Он предоставляет простой интерфейс командной строки (CLI) и может быть интегрирован в проекты Python для обработки аудио с настраиваемыми параметрами.

Установка

Вы можете установить пакет с помощью pip :

pip install rvc-inferpy

Использование

Интерфейс командной строки (CLI)

Вы можете взаимодействовать с rvc_inferpy через командную строку. Чтобы просмотреть доступные параметры и как использовать инструмент, запустите:

rvc-cli -h

Вот разбивка полных параметров командной строки:

usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH] 
                 [--f0_change F0_CHANGE] [--f0_method F0_METHOD] 
                 [--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH] 
                 [--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE] 
                 [--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE] 
                 [--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE] 
                 [--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP] 
                 [--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY] 
                 [--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT] 
                 [--resample_sr RESAMPLE_SR]

Параметры командной строки:

-h, --help : Показать сообщение справки и выход.
--model_name MODEL_NAME : имя или путь модели.
--audio_path AUDIO_PATH : path to Input Audio File.
--f0_change F0_CHANGE : Коэффициент изменения высоты.
--f0_method F0_METHOD : Метод оценки F0 (например, "Crepe").
--min_pitch MIN_PITCH : минимальное значение шага.
--max_pitch MAX_PITCH : максимальное значение шага.
--crepe_hop_length CREPE_HOP_LENGTH : длина крепа-хопа.
--index_rate INDEX_RATE : индексная скорость.
--filter_radius FILTER_RADIUS : радиус фильтра.
--rms_mix_rate RMS_MIX_RATE : Скорость смеси RMS.
--protect PROTECT : защитите фактор, чтобы избежать искажений.
--split_infer : включить разделенный вывод.
--min_silence MIN_SILENCE : минимальная продолжительность молчания (в секундах).
--silence_threshold SILENCE_THRESHOLD : Порог молчания в дБ.
--seek_step SEEK_STEP : размер шага для обнаружения молчания.
--keep_silence KEEP_SILENCE : продолжительность, чтобы сохранить молчание (в считанные секунды).
--do_formant : включить обработку форманта.
--quefrency QUEFRENCY : корректировка Quefrency.
--timbre TIMBRE : Timbre Factorment.
--f0_autotune : включить автоматическую настройку F0.
--audio_format AUDIO_FORMAT : желаемый аудио формат вывода (например, "wav", "mp3").
--resample_sr RESAMPLE_SR : Resample Screed.

Пример команды:

rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800

Как зависимость в проекте Python

Вы также можете использовать rvc_inferpy непосредственно в ваших проектах Python. Вот пример:

 from rvc_inferpy import infer_audio

inferred_audio = infer_audio (
    MODEL_NAME = "model_name_here" ,       # Name or path to the RVC model
    SOUND_PATH = "path_to_audio.wav" ,     # Path to the input audio file
    F0_CHANGE = 0 ,                        # Change in fundamental frequency
    F0_METHOD = "crepe" ,                  # F0 extraction method ("crepe", "dio", etc.)
    MIN_PITCH = 50 ,                       # Minimum pitch value
    MAX_PITCH = 800 ,                      # Maximum pitch value
    CREPE_HOP_LENGTH = 128 ,               # Hop length for Crepe
    INDEX_RATE = 1.0 ,                     # Index rate for model inference
    FILTER_RADIUS = 3 ,                    # Radius for smoothing filters
    RMS_MIX_RATE = 0.75 ,                  # Mixing rate for RMS
    PROTECT = 0.33 ,                       # Protect level to prevent overfitting
    SPLIT_INFER = True ,                   # Whether to split audio for inference
    MIN_SILENCE = 0.5 ,                    # Minimum silence duration for splitting
    SILENCE_THRESHOLD = - 40 ,              # Silence threshold in dB
    SEEK_STEP = 10 ,                       # Seek step in milliseconds
    KEEP_SILENCE = 0.1 ,                   # Keep silence duration in seconds
    QUEFRENCY = 0.0 ,                      # Cepstrum quefrency adjustment
    TIMBRE = 1.0 ,                         # Timbre preservation level
    F0_AUTOTUNE = False ,                  # Enable or disable F0 autotuning
    OUTPUT_FORMAT = "wav"                 # Desired output format (e.g., "wav", "mp3")
)

Функция infer_audio вернет обработанный аудио -объект на основе предоставленных параметров

Вы также можете использовать этот новый режим вывода

 from rvc_inferpy import infernew


infer = infernew(
    model_name="model_name_here",
    sound_path="path_to_audio.wav",
    f0_change=0
)

output_audio = infer.run_inference()
print("Inference completed:", output_audio)

Скачать модели

Вы также можете скачать свои собственные модели RVC, используя


from rvc_inferpy import download_rvc_model dlrvc

dlrvc("URL_HERE", "model_name")

Примечание

Модели DownLoas только разрешали ссылки Huggingface, Google Drive, and Pixeldrain .

Кончик

Убедитесь, что вы загружаете свои модели в папку models/{model_name} .

Условия эксплуатации

Использование конвертированного голоса для следующих целей запрещено.

Критикуя или нападая на людей.
Выступая за конкретные политические позиции, религии или идеологии.
Публично отображая сильно стимулирующие выражения без правильного зонирования.
Продажа голосовых моделей и сгенерированных голосовых клипов.
Выражение первоначального владельца голоса со злонамеренными намерениями причинить вред/навредить другим.
Мошеннические цели, которые приводят к краже личных данных или мошенническим телефонным звонкам.

Отказ от ответственности

Я не несет ответственности за какие -либо прямые, косвенные, косвенные, случайные или специальные убытки, возникающие из -за или каким -либо образом связаны с использованием/неправильным использованием или неспособностью использовать это программное обеспечение.