Dublagem automática com clonagem de voz e reconhecimento de fala
Tornado possível graças a OpenVoice, Melotts, Whisper mais rápido, botefixer, Python-Audio-Separator e FFMPEG.

Os PRs são bem-vindos, isso é principalmente apenas uma prova de conceito. Algumas boas idéias de melhoria incluem:
Instale o FFMPEG, o FFProbe e o FFPLAY no seu sistema e verifique se eles estão no caminho. Você pode baixá -los aqui.
Faça um novo diretório e clone este repositório:
git clone https://github.com/igerman00/Pollyduble
cd Pollydubleconda create -n dubbing python=3.9conda activate dubbinggit clone https://github.com/myshell-ai/OpenVoiceVerifique se o repositório do OpenVoice está no mesmo diretório que este repositório, ele deve ser nomeado "OpenVoice".
cd OpenVoice
pip install -e .
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic downloadtorch com suporte à GPU (o parâmetro Index-URL deve ser opcional para nenhum suporte à GPU): pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 cd .. # Go back to the root directory of the repo
pip install -r requirements-win-cu118.txtdemo.py , e ele é chamado de video.mp4 .python demo.py -i video.mp4 -s -m A saída será armazenada no diretório de Pollyduble/output por padrão. Ele conterá vários arquivos, incluindo o vídeo dublado, o áudio separado, o áudio dublado e a amostra de voz. Principalmente, deve ser um clique.
As opções incluem:
-iou--inputpara especificar o arquivo de vídeo de entrada-oou--outputpara especificar o diretório de saída (o padrão éPollyduble/output)-vou--voicepara especificar uma amostra personalizada para a clonagem de voz. Se não for especificado, um será criado a partir dos primeiros 15 segundos do vídeo-sou--separatepara ativar a separação de áudio, ou seja, extraindo a música de fundo e o discurso do vídeo separadamente-mou--muxpara ativar o muxing o áudio separado de volta ao vídeo com o discurso chamado-fou--fixpara permitir a fixação de voz, ou seja, melhorando a qualidade do discurso chamado.
^ Experimental e na verdade não parece tão bom na maioria das vezes.--helppara exibir a mensagem de ajuda
Este projeto está licenciado sob a licença do MIT - consulte o arquivo de licença para obter detalhes.