end to end_deepfake_colab Download - end to end_deepfake

end to end_deepfake_colab

Código-Fonte de IA

1.0.0

Baixar

Geração de vídeo de ponta a ponta Deepfake

Visão geral

Este notebook Colab fornece um guia passo a passo para gerar um vídeo Deepfake clonando uma voz em um vídeo. O processo envolve o upload de arquivos de vídeo e voz, renomeá -los, extrair áudio, criar pedaços de áudio e finalmente usar o WAV2LIP para geração DeepFake.

Passos

Antes de executar este notebook, precisamos ter uma pasta em nosso Google Drive chamado deepfake com pelo menos um arquivo de vídeo (formato MP4). É altamente recomendável incluir também um arquivo de áudio (formato MP3) para clonar a voz. Especialmente para casos de idioma não inglês no vídeo, é essencial fazer upload de um arquivo de áudio em inglês também.

Cuidado: o prompt de texto deve ser separado com '|' Cada a duas frases (a cada ~ 20 segundos necessários para lê -lo). Se você receber algum aviso e reiniciar a sessão (após a instalação de uma biblioteca - por exemplo, Librosa, conforme mostrado na figura abaixo), clique em 'Cancelar'. Na versão gratuita (T4 ou V100 com VRAM de 15 GB e ~ 13 GB de RAM), a duração máxima de áudio/vídeo pode ser ~ 50 segundos (leva ~ 30mins para executar o script e obter resultados). Para um prompt de texto mais longo, é necessária uma GPU maior (versão paga usando L4 com VRAM de 22,5 GB e ~ 63 GB de RAM ou A100 com VRAM de 40 GB e ~ 84 GB de RAM - o último usa mais unidades de computação/hora).

1. Carregar arquivos de vídeo e voz

Monte o Google Drive para acessar arquivos.
Altere o diretório para o caminho especificado.

 from google . colab import drive
drive . mount ( '/content/gdrive' )

cd gdrive / MyDrive / deepfake

2. Defina o caminho da base

Especifique o caminho base para arquivos de vídeo e áudio.

 base_path = '/content/gdrive/MyDrive/deepfake'

3. Instale dependências

Instale as bibliotecas TTS, Pydub e Moviepy.

!p ip install - q pydub == 0.25 . 1 TTS == 0.22 . 0 moviepy == 1.0 . 3

4. Defina o texto para ler

Defina o texto em inglês que será lido com a voz clonada.

 text_to_read = "Joining two modalities results in a surprising increase in generalization! \ n What would happen if we combined them all? "

5. Renomear arquivos de áudio e vídeo

Renomeie os arquivos de áudio e vídeo enviados para input_voice.mp3 e video_full.mp4 , respectivamente.

6. Extraia o áudio do vídeo (se necessário)

Se apenas um vídeo for fornecido, extraia áudio para ser usado para clonar o indivíduo.

7. Crie pedaços de áudio

Crie uma pasta com pedaços de áudio de 10 segundos para serem usados como entrada na tartaruga.

8. Confirme duração de áudio e vídeo

Verifique se o áudio e o vídeo têm a mesma duração. Caso contrário, apare o mais longo para corresponder ao mais curto (ou corte -os a 20 segundos).

9. CLONE WAV2LIP repositório e modelos de download

CLONE WAV2LIP Github Repository, baixe modelos pré-treinados e instale dependências.

10. Gere Deepfake

Execute o script de inferência WAV2LIP para gerar o vídeo Deepfake.

11. Limpeza

Remova arquivos e pastas temporárias.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-23
tamanho 57.09KB
Vindo de Github

Aplicativos Relacionados

Newsletter_sign up_form

2024-11-01
Fim de Aeon

2022-08-28
Fim das estrelas

2022-08-24
Trabalho sem saída

2022-08-22
Watchmen: O fim está próximo

2022-08-10
Fim fatídico: arquivos de casos verdadeiros

2022-07-24

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos