fastVC
1.0.0
FASTVC是一种快速有效的,非平行的和任何对任何语音转换(VC)工具。 VC涉及源扬声器的声音的修改,以使其听起来像目标扬声器的声音,而不会更改句子的语言内容。我们的工具通过级联自动语音识别(ASR)模型和语音(TTS)模型的文本来利用任务。

ASR基于WAV2VEC 2.0,用于从源发言人转录演讲。 TTS基于SV2TTS,用于从目标扬声器嵌入中生成输出语音。
有关更详细的说明,请查看我们项目的论文。这里有一个演示页面。
该软件是使用python 3.9.4实施的
git clone https://github.com/fmiotello/fastVC.git )并输入目录( cd fastVC )python -m venv env和source env/bin/activate (如果使用macOS/linux)或.envScriptsactivatepython -m pip install --upgrade pippython -m pip install -r requirements.txt ./src/encoder/saved_models/pretrained.pt
./src/synthesizer/saved_models/pretrained/pretrained.pt
./src/vocoder/saved_models/pretrained/pretrained.pt
python src/main.py (使用--help用于显示可用选项)。输出音频将为./src/audio/audio_out.wav 。可以在这里找到更多说明。
该应用程序是在Politecnico di Milano(音乐和声学工程学的MSC)的项目中开发的。
路易吉·阿托雷西(Luigi Attorresi)
费德里科·米特洛(Federico Miotello)
Eugenio Poliuti