Автоматическое дублирование с помощью голосового клонирования и распознавания речи
Сделано возможным благодаря OpenVoice, Melotts, более быстрому шепоту, голосовой машине, Python-Audio-Sparator и Ffmpeg.

Приветствуются PRS, это в основном просто подтверждение концепции. Некоторые хорошие идеи для улучшения включают:
Установите на систему FFMPEG, FFProbe и FFPLAY и убедитесь, что они находятся на пути. Вы можете скачать их отсюда.
Сделайте новый каталог и клонируйте этот репозиторий:
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoiceУбедитесь, что репозиторий OpenVoice находится в том же каталоге, что и в этом репозитории, его следует назвать «OpenVoice».
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch с поддержкой GPU (параметр Index-Url должен быть необязательным для поддержки GPU): pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py , и он называется video.mp4 .python demo.py -i video.mp4 -s -m Вывод будет храниться в каталоге Pollyduble/output по умолчанию. Он будет содержать различные файлы, включая дублированное видео, отдельное звук, дублированное звук и образец голоса. В основном это должно быть один щелчок.
Варианты включают:
-iили--input, чтобы указать входной видеофайл-oили--outputдля указания выходного каталога (по умолчанию естьPollyduble/output)-vили--voice, чтобы указать пользовательский образец для голосового клонирования. Если не указано, один будет создан с первых 15 секунд видео-sили--separate, чтобы включить разлучение аудио, то есть извлечение фоновой музыки и речи из видео отдельно-mили--mux, чтобы включить разводящий звук обратно в видео с дублированной речью-fили--fix, чтобы включить исправление голоса, то есть улучшение качества дублированной речи.
^ Экспериментальный и на самом деле не звучит так хорошо большую часть времени.--help, чтобы отобразить сообщение справки
Этот проект лицензирован по лицензии MIT - для получения подробной информации см. Файл лицензии.