注記
このプロジェクトはまだ開発中です。
rvc_inferpy 、RVC(検索ベースの音声変換)でオーディオ推論を実行するためのPythonライブラリです。シンプルなコマンドラインインターフェイス(CLI)を提供し、カスタマイズ可能なパラメーターを使用してオーディオ処理のためにPythonプロジェクトに統合できます。
pipを使用してパッケージをインストールできます。
pip install rvc-inferpyコマンドラインを介してrvc_inferpyと対話できます。利用可能なオプションとツールの使用方法を表示するには、実行してください。
rvc-cli -h完全なコマンドラインオプションの内訳は次のとおりです。
usage: rvc-cli [-h] [--model_name MODEL_NAME] [--audio_path AUDIO_PATH]
[--f0_change F0_CHANGE] [--f0_method F0_METHOD]
[--min_pitch MIN_PITCH] [--max_pitch MAX_PITCH]
[--crepe_hop_length CREPE_HOP_LENGTH] [--index_rate INDEX_RATE]
[--filter_radius FILTER_RADIUS] [--rms_mix_rate RMS_MIX_RATE]
[--protect PROTECT] [--split_infer] [--min_silence MIN_SILENCE]
[--silence_threshold SILENCE_THRESHOLD] [--seek_step SEEK_STEP]
[--keep_silence KEEP_SILENCE] [--do_formant] [--quefrency QUEFRENCY]
[--timbre TIMBRE] [--f0_autotune] [--audio_format AUDIO_FORMAT]
[--resample_sr RESAMPLE_SR] -h, --help :ヘルプメッセージと出口を表示します。--model_name MODEL_NAME :モデルの名前またはパス。--audio_path AUDIO_PATH :入力オーディオファイルへのパス。--f0_change F0_CHANGE :ピッチ変更ファクター。--f0_method F0_METHOD :F0推定方法(例:「クレープ」)。--min_pitch MIN_PITCH :最小ピッチ値。--max_pitch MAX_PITCH :最大ピッチ値。--crepe_hop_length CREPE_HOP_LENGTH :クレープホップの長さ。--index_rate INDEX_RATE :インデックスレート。--filter_radius FILTER_RADIUS :フィルター半径。--rms_mix_rate RMS_MIX_RATE :rmsミックスレート。--protect PROTECT :歪みを避けるために要因を保護します。--split_infer :分割推論を有効にします。--min_silence MIN_SILENCE :最小沈黙期間(秒単位)。--silence_threshold SILENCE_THRESHOLD :dbの沈黙のしきい値。--seek_step SEEK_STEP :沈黙検出のステップサイズ。--keep_silence KEEP_SILENCE :沈黙を維持するための期間(秒単位)。--do_formant :フォーマント処理を有効にします。--quefrency QUEFRENCY :Quefrecy調整。--timbre TIMBRE :音色調整係数。--f0_autotune :自動F0チューニングを有効にします。--audio_format AUDIO_FORMAT :希望の出力オーディオ形式(例: "wav"、 "mp3")。--resample_sr RESAMPLE_SR :サンプルサンプルレート。rvc-cli --model_name " model_name_here " --audio_path " path_to_audio.wav " --f0_change 0 --f0_method " crepe " --min_pitch 50 --max_pitch 800Pythonプロジェクトでrvc_inferpy直接使用することもできます。これが例です:
from rvc_inferpy import infer_audio
inferred_audio = infer_audio (
MODEL_NAME = "model_name_here" , # Name or path to the RVC model
SOUND_PATH = "path_to_audio.wav" , # Path to the input audio file
F0_CHANGE = 0 , # Change in fundamental frequency
F0_METHOD = "crepe" , # F0 extraction method ("crepe", "dio", etc.)
MIN_PITCH = 50 , # Minimum pitch value
MAX_PITCH = 800 , # Maximum pitch value
CREPE_HOP_LENGTH = 128 , # Hop length for Crepe
INDEX_RATE = 1.0 , # Index rate for model inference
FILTER_RADIUS = 3 , # Radius for smoothing filters
RMS_MIX_RATE = 0.75 , # Mixing rate for RMS
PROTECT = 0.33 , # Protect level to prevent overfitting
SPLIT_INFER = True , # Whether to split audio for inference
MIN_SILENCE = 0.5 , # Minimum silence duration for splitting
SILENCE_THRESHOLD = - 40 , # Silence threshold in dB
SEEK_STEP = 10 , # Seek step in milliseconds
KEEP_SILENCE = 0.1 , # Keep silence duration in seconds
QUEFRENCY = 0.0 , # Cepstrum quefrency adjustment
TIMBRE = 1.0 , # Timbre preservation level
F0_AUTOTUNE = False , # Enable or disable F0 autotuning
OUTPUT_FORMAT = "wav" # Desired output format (e.g., "wav", "mp3")
) infer_audio関数は、提供されたパラメーターに基づいて処理されたオーディオオブジェクトを返します
from rvc_inferpy import infernew
infer = infernew(
model_name="model_name_here",
sound_path="path_to_audio.wav",
f0_change=0
)
output_audio = infer.run_inference()
print("Inference completed:", output_audio)
また、独自のRVCモデルを使用してダウンロードすることもできます
from rvc_inferpy import download_rvc_model dlrvc
dlrvc("URL_HERE", "model_name")
注記
DownloasモデルはHuggingface, Google Drive, and Pixeldrainリンクのみを許可しました。
ヒント
models/{model_name}フォルダーにモデルをアップロードしてください。
次の目的で変換された音声の使用は禁止されています。
個人を批判または攻撃する。
特定の政治的地位、宗教、またはイデオロギーを擁護する、または反対する。
適切なゾーニングなしで強く刺激的な表現を公開します。
音声モデルと生成された音声クリップの販売。
他の人を傷つけたり傷つけたりするという悪意のある意図を持って、声の元の所有者のなりすまし。
個人情報の盗難や不正な電話につながる詐欺目的。
私は、このソフトウェアの使用/誤用または使用不能に起因する、または何らかの形で発生する、または何らかの形で発生する、直接的、間接的、結果的、偶発的、または特別な損害について責任を負いません。
このプロジェクトは、MITライセンスの下でライセンスされています。