Pollyduble
1.0.0
用语音克隆和语音识别的自动配音
得益于OpenVoice,Melotts,更快的耳语,VoiceFixer,Python-Audio-separator和ffmpeg,这使得成为可能。

欢迎PRS,这主要只是概念验证。一些改进的好主意包括:
在系统上安装FFMPEG,FFPROBE和FFPLAY,并确保它们处于路径状态。您可以从这里下载它们。
制作一个新的目录并克隆此存储库:
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoice确保OpenVoice存储库与此存储库相同的目录,应命名为“ OpenVoice”。
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch (索引-URL参数应是可选的,不需要GPU支持): pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py脚本相同,并且被命名为video.mp4 。python demo.py -i video.mp4 -s -m默认情况下,输出将存储在Pollyduble/output目录中。它将包含各种文件,包括配音视频,分离的音频,配音音频和语音示例。通常,它应该是一键。
选项包括:
-i或--input以指定输入视频文件-o或--output指定输出目录(默认为Pollyduble/output)-v或--voice为语音克隆指定自定义样本。如果未指定,将从视频的前15秒起创建一个-s或--separate启用音频分离,即分别提取背景音乐和演讲-m或--mux可以用配音的语音使分开的音频恢复到视频中-f或--fix启用语音固定,即提高配音语音的质量。
^实验性,实际上在大多数情况下听起来不好。--help显示帮助消息
该项目是根据MIT许可证获得许可的 - 有关详细信息,请参见许可证文件。