使用任何經過 RVC v2 訓練的 AI 語音模型來改變聲音的自主管道。該工具可用於將語音轉換應用於任何音訊輸入。


WebUI 正在不斷開發和測試中,但您現在可以在本地嘗試!
透過在RVC-v2-UI目錄中開啟命令列視窗並執行以下命令來安裝和提取任何新的要求和變更。
pip install -r requirements.txt git pull
對於 Colab 用戶,只需按一下 Colab Notebook 頂部導覽列中的Runtime ,然後在下拉式功能表中Disconnect and delete runtime 。然後按照筆記本中的說明執行 webui。
(希望很快就會到來)
請按照此處的說明在您的電腦上安裝 Git。如果您還沒有安裝 Python VERSION 3.9,請依照本指南進行安裝。使用其他版本的 Python 可能會導致依賴衝突。
或者,您可以使用 pyenv 來管理 Python 版本:
請按照此處的說明安裝 pyenv。
安裝Python 3.9:
pyenv install 3.9
將其設定為本機 Python 版本:
pyenv local 3.9
請按照此處的說明在您的電腦上安裝 ffmpeg。
打開命令列視窗並執行這些命令來複製整個儲存庫、建立虛擬環境並安裝所需的其他依賴項。
git clone https://github.com/PseudoRAM/RVC-v2-UI cd RVC-v2-UI
pyenv exec python -m venv venv
python -m venv venv
venvScriptsactivate
source venv/bin/activate
pip install -r requirements.txt
執行以下命令下載所需的 hubert 基礎模型。
python src/download_models.py

若要執行 RVC Voice Changer WebUI,請執行以下命令。
python src/webui.py
| 旗幟 | 描述 |
|---|---|
-h , --help | 顯示此幫助訊息並退出。 |
--share | 建立公共 URL。這對於在 Google Colab 上運行 Web UI 非常有用。 |
--listen | 使 Web UI 可從您的本機網路存取。 |
--listen-host LISTEN_HOST | 伺服器將使用的主機名稱。 |
--listen-port LISTEN_PORT | 伺服器將使用的偵聽連接埠。 |
一旦出現以下輸出訊息Running on local URL: http://127.0.0.1:7860 ,您可以按一下該連結以使用 WebUI 開啟選項卡。
導航至Download model標籤,將下載連結貼到 RVC 模型並為其指定一個唯一的名稱。您可以搜尋 AI Hub Discord,其中已經訓練好的語音模型可供下載。您可以參考範例來了解下載連結的外觀。下載的 zip 檔案應包含 .pth 模型檔案和可選的 .index 檔案。
填寫完 2 個輸入欄位後,只需按一下Download !一旦輸出訊息顯示[NAME] Model successfully downloaded! ,單擊刷新模型按鈕後,您應該能夠在Convert Voice選項卡中使用它!


適合在本地訓練過 RVC v2 模型並希望使用它們進行語音轉換的人。導航至Upload model選項卡,然後按照說明進行操作。一旦輸出訊息顯示[NAME] Model successfully uploaded! ,單擊刷新模型按鈕後,您應該能夠在Convert Voice選項卡中使用它!


從語音模型下拉式選單中,選擇要使用的語音模型。如果您手動將檔案新增至 rvc_models 目錄中,請按一下Refresh Models以刷新清單。
在輸入音訊欄位中,上傳您的音訊檔案。
根據需要調整音高。這會改變輸出語音的音高。
可以透過點擊手風琴箭頭展開來查看語音轉換的其他進階選項。
填寫完所有選項後,按一下Convert ,AI 產生的語音應該會在幾分鐘內出現,具體取決於您的 GPU。
若要使用命令列運行語音轉換管道,請執行以下命令:
python src/main.py <input_audio> <rvc_model> [pitch] [f0_method] [index_rate] [filter_radius] [rms_mix_rate] [protect]
| 範圍 | 描述 |
|---|---|
input_audio | 輸入音訊檔案的路徑。 |
rvc_model | 要使用的 RVC 模型的名稱。 |
pitch | (可選)半音的音調變化。預設值為 0。 |
f0_method | (可選)音調檢測演算法。選項:「rmvpe」(預設)或「mangio-crepe」。 |
index_rate | (可選)語音轉換的索引率。預設值為 0.5。範圍:0 到 1。 |
filter_radius | (可選)中值濾波的濾波器半徑。預設值為 3。 |
rms_mix_rate | (可選)RMS 混合率。預設值為 0.25。範圍:0 到 1。 |
protect | (可選)保護速率以保留一些原始語音特徵。預設值為 0.33。範圍:0 到 0.5。 |
用法範例:
python src/main.py "path/to/input/audio.wav" "JohnDoe" 2 rmvpe 0.7 3 0.3 0.35
此指令將使用「JohnDoe」RVC模型轉換「audio.wav」中的語音,將音調提高2個半音,使用「rmvpe」音調偵測演算法,索引率為0.7,濾波器半徑為3,RMS mix速率0.3,保護率0.35。
解壓縮(如果需要)並將.pth和.index檔案傳輸到 rvc_models 目錄中的新資料夾。每個資料夾只能包含 1 個.pth和 1 個.index檔案。
目錄結構應該如下圖所示:
├── rvc_models │ ├── John │ │ ├── JohnV2.pth │ │ └── added_IVF2237_Flat_nprobe_1_v2.index │ ├── May │ │ ├── May.pth │ │ └── added_IVF2237_Flat_nprobe_1_v2.index │ ├── MODELS.txt │ └── hubert_base.pt ├── voice_output └── src
禁止將轉換後的語音用於以下目的。
批評或攻擊個人。
提倡或反對特定的政治立場、宗教或意識形態。
在沒有適當分區的情況下公開展示強烈刺激的表情。
銷售語音模型和產生的語音片段。
冒充聲音原主人,惡意傷害/傷害他人。
導致身分盜用或詐欺電話的詐欺目的。
對於因使用/誤用或無法使用本軟體而引起的或以任何方式與之相關的任何直接、間接、後果性、偶然或特殊損害,我不承擔任何責任。