該項目現在具有便攜式版本,因此您不必遇到安裝所有依賴項的麻煩。
點擊此處下載
除了Windows和具有6 GB視頻內存的NVIDIA圖形卡外,您什麼都不需要。
英語
俄語
葡萄牙
XTTS-WEBUI是一個Web界面,可讓您充分利用XTT。該界面周圍還有其他神經網絡可以改善您的結果。您還可以微調模型並獲得高質量的語音模型。

通過Google Colab使用此Web UI
請確保您擁有Python 3.10.x或Python 3.11,CUDA 11.8或CUDA 12.1,Microsoft Builder Tools 2019帶有C ++軟件包,並安裝了FFMPEG
開始:
開始:
請按照以下步驟進行安裝:
確保安裝CUDA
克隆存儲庫: git clone https://github.com/daswer123/xtts-webui
導航到目錄: cd xtts-webui
創建虛擬環境: python -m venv venv
激活虛擬環境:
venvscriptsactivatesource venvbinactivate使用PIP命令安裝Pytorch和Torchaudio:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
從unignts.txt安裝所有依賴項:
pip install -r requirements.txt
要啟動界面,請按照以下步驟:
激活您的虛擬環境:
venv/scripts/activate或者,如果您在Linux上
source venv/bin/activate然後通過運行此命令來啟動XTT的WebUI:
python app.py以下是一些運行時參數,可以在啟動應用程序時使用:
| 爭論 | 預設值 | 描述 |
|---|---|---|
| -HS, - 主持人 | 127.0.0.1 | 主機約束 |
| -p, - 港口 | 8010 | 要收聽的端口號 |
| -d, - 設備 | 庫達 | 要使用哪種設備(CPU或CUDA) |
| -sf, - spearder_folder | 演講者/ | 包含TTS樣品的目錄 |
| -o, - 輸出 | “輸出/” | 輸出目錄 |
| -l, - 語言 | “汽車” | WebUI語言,您可以在I18N/LOCALE文件夾中看到可用的翻譯。 |
| -ms, - 模型源 | “當地的” | 定義模型源:用於使用本地推理和模型v2.0.2的存儲庫中的最新版本的“ API”。 |
| -v,-version | “ v2.0.2” | 您可以指定要使用的XTT版本。您可以為此目的指定自定義模型的名稱 |
| - Lowvram | 啟用低VRAM模式,該模式在不積極處理時將模型切換為RAM | |
| - 深度 | 啟用深速加速。在Python 3.10和3.11上的Windows上作品 | |
| - 分享 | 允許在本地計算機外共享接口 | |
| -rvc | 啟用RVC後處理,所有型號均應在RVC文件夾中定位 |
RVC的模塊,您可以啟用RVC模塊以後處理收到的音頻,如果您在控制台中運行或將其寫入啟動文件,則需要添加-RVC標誌
為了使模型在RVC設置中工作,您需要選擇一個必須首先上傳到Voice2Voice/RVC文件夾的模型,模型和索引文件必須在一起,索引文件是可選的,每個模型必須在單獨的文件夾中。