fastVC下載 - fastVC源代碼下載

下載

FastVC

FASTVC是一種快速有效的，非平行的和任何對任何語音轉換（VC）工具。 VC涉及源揚聲器的聲音的修改，以使其聽起來像目標揚聲器的聲音，而不會更改句子的語言內容。我們的工具通過級聯自動語音識別（ASR）模型和語音（TTS）模型的文本來利用任務。

ASR基於WAV2VEC 2.0，用於從源發言人轉錄演講。 TTS基於SV2TTS，用於從目標揚聲器嵌入中生成輸出語音。

有關更詳細的說明，請查看我們項目的論文。這裡有一個演示頁面。

該軟件是使用python 3.9.4實施的

克隆存儲庫（ git clone https://github.com/fmiotello/fastVC.git ）並輸入目錄（ cd fastVC ）
（可選）創建虛擬env並激活它： python -m venv env和source env/bin/activate （如果使用macOS/linux）或.envScriptsactivate
升級PIP： python -m pip install --upgrade pip
安裝依賴項： python -m pip install -r requirements.txt
下載預審計的模型（編碼器，合成器，Vocoder），並將其放入正確的目錄：

 ./src/encoder/saved_models/pretrained.pt
./src/synthesizer/saved_models/pretrained/pretrained.pt
./src/vocoder/saved_models/pretrained/pretrained.pt

運行主腳本： python src/main.py （使用--help用於顯示可用選項）。輸出音頻將為./src/audio/audio_out.wav 。

可以在這裡找到更多說明。

該應用程序是在Politecnico di Milano（音樂和聲學工程學的MSC）的項目中開發的。

路易吉·阿托雷西（Luigi Attorresi）
費德里科·米特洛（Federico Miotello）
Eugenio Poliuti

展開

附加信息

相關應用

爲您推薦

相關資訊全部