fastVC下载 - fastVC源代码下载

下载

FastVC

FASTVC是一种快速有效的，非平行的和任何对任何语音转换（VC）工具。 VC涉及源扬声器的声音的修改，以使其听起来像目标扬声器的声音，而不会更改句子的语言内容。我们的工具通过级联自动语音识别（ASR）模型和语音（TTS）模型的文本来利用任务。

ASR基于WAV2VEC 2.0，用于从源发言人转录演讲。 TTS基于SV2TTS，用于从目标扬声器嵌入中生成输出语音。

有关更详细的说明，请查看我们项目的论文。这里有一个演示页面。

该软件是使用python 3.9.4实施的

克隆存储库（ git clone https://github.com/fmiotello/fastVC.git ）并输入目录（ cd fastVC ）
（可选）创建虚拟env并激活它： python -m venv env和source env/bin/activate （如果使用macOS/linux）或.envScriptsactivate
升级PIP： python -m pip install --upgrade pip
安装依赖项： python -m pip install -r requirements.txt
下载预审计的模型（编码器，合成器，Vocoder），并将其放入正确的目录：

 ./src/encoder/saved_models/pretrained.pt
./src/synthesizer/saved_models/pretrained/pretrained.pt
./src/vocoder/saved_models/pretrained/pretrained.pt

运行主脚本： python src/main.py （使用--help用于显示可用选项）。输出音频将为./src/audio/audio_out.wav 。

可以在这里找到更多说明。

该应用程序是在Politecnico di Milano（音乐和声学工程学的MSC）的项目中开发的。

路易吉·阿托雷西（Luigi Attorresi）
费德里科·米特洛（Federico Miotello）
Eugenio Poliuti

展开

附加信息