fastVC
1.0.0
FASTVC是一種快速有效的,非平行的和任何對任何語音轉換(VC)工具。 VC涉及源揚聲器的聲音的修改,以使其聽起來像目標揚聲器的聲音,而不會更改句子的語言內容。我們的工具通過級聯自動語音識別(ASR)模型和語音(TTS)模型的文本來利用任務。

ASR基於WAV2VEC 2.0,用於從源發言人轉錄演講。 TTS基於SV2TTS,用於從目標揚聲器嵌入中生成輸出語音。
有關更詳細的說明,請查看我們項目的論文。這裡有一個演示頁面。
該軟件是使用python 3.9.4實施的
git clone https://github.com/fmiotello/fastVC.git )並輸入目錄( cd fastVC )python -m venv env和source env/bin/activate (如果使用macOS/linux)或.envScriptsactivatepython -m pip install --upgrade pippython -m pip install -r requirements.txt ./src/encoder/saved_models/pretrained.pt
./src/synthesizer/saved_models/pretrained/pretrained.pt
./src/vocoder/saved_models/pretrained/pretrained.pt
python src/main.py (使用--help用於顯示可用選項)。輸出音頻將為./src/audio/audio_out.wav 。可以在這裡找到更多說明。
該應用程序是在Politecnico di Milano(音樂和聲學工程學的MSC)的項目中開發的。
路易吉·阿托雷西(Luigi Attorresi)
費德里科·米特洛(Federico Miotello)
Eugenio Poliuti