Download de talking head anime 3 demo - talking head anime 3 demo

talking head anime 3 demo

Outro código-fonte

1.0.0

Baixar

Código de demonstração para "falando de cabeça (?) Anime de uma única imagem 3: agora o corpo também"

Este repositório contém programas de demonstração para o Anime da Chefe de Talking (?) De uma única imagem 3: agora o projeto também. Como o nome indica, o projeto permite animar caracteres de anime e você só precisa de uma única imagem desse personagem para fazê -lo. Existem dois programas de demonstração:

O manual_poser permite manipular a expressão facial de um personagem, a rotação da cabeça, a rotação do corpo e a expansão do peito devido à respiração através de uma interface gráfica do usuário.
ifacialmocap_puppeteer permite transferir seu movimento facial para um personagem de anime.

Experimente o poser manual no Google Colab

Se você não possui o hardware necessário (discutido abaixo) ou não deseja baixar o código e configurar um ambiente para executá -lo, clique para tentar executar o Poser manual no Google Colab.

Requisitos de hardware

Ambos os programas exigem que uma GPU NVIDIA recente e poderosa seja executada. Eu poderia executá -los pessoalmente em boa velocidade com o Nvidia Titan RTX. No entanto, acho que as GPUs de jogos de ponta recentes, como o RTX 2080, o RTX 3080, ou melhor, o fariam da mesma forma.

O ifacialmocap_puppeteer requer um dispositivo iOS capaz de calcular parâmetros de forma de mistura de um feed de vídeo. Isso significa que o dispositivo deve ser capaz de executar o iOS 11.0 ou superior e deve ter uma câmera frontal de ponta. (Consulte esta página para obter mais informações.) Em outras palavras, se você tiver o iPhone X ou algo melhor, você deve estar tudo definido. Pessoalmente, usei um iPhone 12 mini.

Requisitos de software

Software relacionado à GPU

Atualize o driver do dispositivo da GPU e instale o kit de ferramentas CUDA que é compatível com sua GPU e é mais recente que a versão que você estará instalando na próxima subseção.

Ambiente Python

manual_poser e ifacialmocap_puppeteer estão disponíveis como aplicativos de desktop. Para executá -los, você precisa configurar um ambiente para executar programas escritos no idioma Python. O ambiente precisa ter os seguintes pacotes de software:

Python> = 3.8
Pytorch> = 1.11.0 com suporte CUDA
Scipy> = 1.7.3
wxpython> = 4.1.1
Matplotlib> = 3.5.1

Uma maneira de fazer isso é instalar a Anaconda e executar os seguintes comandos em seu shell:

 > conda create -n talking-head-anime-3-demo python=3.8
> conda activate talking-head-anime-3-demo
> conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
> conda install scipy
> pip install wxpython
> conda install matplotlib

Advertência 1: Não use o Python 3.10 no Windows

Em junho de 2006, você não pode usar o WXPYTHON com o Python 3.10 no Windows. Como resultado, não use o Python 3.10 até que este bug seja corrigido. Isso significa que você não deve definir python=3.10 no primeiro comando conda na listagem acima.

Advertência 2: Ajuste as versões do kit de ferramentas Python e Cuda, conforme necessário

O ambiente criado pelos comandos acima oferece a você Python versão 3.8 e uma instalação de pytorch que foi compilada com o CUDA Toolkit versão 11.3. Essa configuração específica pode não funcionar no futuro, porque você pode achar que esse pacote Pytorch específico não funciona com seu novo computador. A solução é::

Altere a versão Python no primeiro comando para um recente que funciona para o seu sistema operacional. (Ou seja, não use 3.10 se você estiver usando o Windows.)
Altere a versão do CUDA Toolkit no terceiro comando para um que o site do Pytorch diz estar disponível. Em particular, role para a seção "Instale Pytorch" e use o escolhedor lá para escolher o comando certo para o seu computador. Use esse comando para instalar o pytorch em vez do terceiro comando acima.

The command to install PyTorch

Ambiente Jupyter

O manual_poser também está disponível como um Jupyter Nootbook. Para executá -lo em suas máquinas locais, você também precisa instalar:

Jupyter Notebook> = 7.3.4
Ipywidgets> = 7.7.0

Em alguns casos, você também precisará ativar o widgetsnbextension . Então, corra

 > jupyter nbextension enable --py widgetsnbextension

Depois de instalar os dois pacotes acima. Usando o Anaconda, consegui fazer o acima com os seguintes comandos:

 > conda install -c conda-forge notebook
> conda install -c conda-forge ipywidgets
> jupyter nbextension enable --py widgetsnbextension

Construção automática de ambiente com anaconda

Você também pode usar o Anaconda para baixar e instalar todos os pacotes Python em um comando. Abra sua concha, altere o diretório para onde você clonou o repositório e corra:

 > conda env create -f environment.yml

Isso criará um ambiente chamado talking-head-anime-3-demo contendo todos os pacotes Python necessários.

ifacialMocap

Se você deseja usar ifacialmocap_puppeteer , também precisará um software iOS chamado ifacialMocap (uma compra de 980 ienes na App Store). Você não precisa baixar o aplicativo pareado desta vez. Seu iOS e seu computador devem usar a mesma rede. Por exemplo, você pode conectá -los ao mesmo roteador sem fio.

Baixe os modelos

Antes de executar os programas, você precisa baixar os arquivos modelo deste link Dropbox e descompactá -lo na pasta data/models no diretório raiz do repositório. No final, a pasta de dados deve parecer:

 + data
  + images
    - crypko_00.png
    - crypko_01.png
        :
    - crypko_07.png
    - lambda_00.png
    - lambda_01.png
  + models
    + separable_float
      - editor.pt
      - eyebrow_decomposer.pt
      - eyebrow_morphing_combiner.pt
      - face_morpher.pt
      - two_algo_face_body_rotator.pt
    + separable_half
      - editor.pt
          :
      - two_algo_face_body_rotator.pt
    + standard_float
      - editor.pt
          :
      - two_algo_face_body_rotator.pt
    + standard_half
      - editor.pt
          :
      - two_algo_face_body_rotator.pt

Os arquivos do modelo são distribuídos com a Licença Internacional Creative Commons Attribution 4.0, o que significa que você pode usá -los para fins comerciais. No entanto, se você os distribui, deve, entre outras coisas, dizer que eu sou o criador.

Executando o aplicativo de desktop `manual_poser`

Abra uma concha. Altere seu diretório de trabalho para o diretório raiz do repositório. Então, corra:

 > python tha3/app/manual_poser.py

Observe que, antes de executar o comando acima, talvez seja necessário ativar o ambiente Python que contém os pacotes necessários. Se você criou um ambiente usando o anaconda como foi discutido acima, você precisa executar

 > conda activate talking-head-anime-3-demo

Se você ainda não ativou o ambiente.

Escolha da variante do sistema para usar

Conforme observado na redação do projeto, criei 4 variantes do sistema de rede neural. Eles são chamados standard_float , separable_float , standard_half e separable_half . Todos eles têm as mesmas funcionalidades, mas diferem em seus tamanhos, uso de RAM, velocidade e precisão. Você pode especificar qual variante o programa manual_poser usa através da opção --model Command Line.

 > python tha3/app/manual_poser --model <variant_name>

onde <variant_name> deve ser um dos 4 nomes acima. Se nenhuma variante for especificada, a variante standard_float (que é a maior, mais lenta e mais precisa) será usada.

Executando o notebook `manual_poser` Jupyter

Abra uma concha. Ative o ambiente. Altere seu diretório de trabalho para o diretório raiz do repositório. Então, corra:

 > jupyter notebook

Uma janela do navegador deve abrir. Nele, open manual_poser.ipynb . Depois de fazer isso, você deve ver que ele possui duas células. Execute as duas células em ordem. Em seguida, role para baixo até o final do documento e você verá a GUI lá.

Você pode escolher a variante do sistema a ser usada alterando a variável MODEL_NAME na primeira célula. Se o fizer, precisará executar novamente as duas células para que a variante seja carregada e a GUI seja atualizada corretamente para usá -la.

Executando o `ifacialmocap_poser`

Primeiro, execute ifacialMocap no seu dispositivo iOS. Ele deve mostrar o endereço IP do dispositivo. Anote. Mantenha o aplicativo aberto.

IP address in iFacialMocap screen

Abra uma concha. Ative o ambiente Python. Altere seu diretório de trabalho para o diretório raiz do repositório. Então, corra:

 > python tha3/app/ifacialmocap_puppeteer.py

Você verá uma caixa de texto com a etiqueta "Capture Disposition IP". Escreva o endereço IP do dispositivo iOS que você anotou lá.

Write IP address of your iOS device in the 'Capture Device IP' text box.

Clique na "Iniciar captura!" botão à direita.

Click the 'START CAPTURE!' button.

Se os programas estiverem conectados corretamente, você verá os números na parte inferior da janela alterar quando você mover a cabeça.

The numbers in the bottom part of the window should change when you move your head.

Agora, você pode carregar uma imagem de um personagem e deve seguir seu movimento facial.

Contranta nas imagens de entrada

Para que o sistema funcione bem, a imagem de entrada deve obedecer às seguintes restrições:

Deve ser da resolução 512 x 512. (Se os programas de demonstração receber uma imagem de entrada de qualquer outro tamanho, eles redimensionarão a imagem para esta resolução e também a saída nesta resolução.)
Deve ter um canal alfa.
Deve conter apenas um caráter humanóide.
O personagem deve estar de pé e voltado para a frente.
As mãos do personagem devem estar abaixo e longe da cabeça.
A cabeça do personagem deve estar aproximadamente contida na caixa de 128 x 128 no meio da metade superior da imagem.
Os canais alfa de todos os pixels que não pertencem ao personagem (ou seja, pixels de fundo) devem ser 0.

An example of an image that conforms to the above criteria

Consulte a redação do projeto para obter mais detalhes sobre a imagem de entrada.

Citação

Se o seu trabalho acadêmico se beneficiar do código neste repositório, cite a página da web do projeto da seguinte forma:

Pramook Khungurn. Cabeça de falar (?) Anime de uma única imagem 3: agora o corpo também. http://pkhungurn.github.io/talking-wead-anime-3/, 2022. Acesso: AAAAA-MM-DD.

Você também pode usar a seguinte entrada Bibtex:

 @misc{Khungurn:2022,
    author = {Pramook Khungurn},
    title = {Talking Head(?) Anime from a Single Image 3: Now the Body Too},
    howpublished = {url{http://pkhungurn.github.io/talking-head-anime-3/}},
    year = 2022,
    note = {Accessed: YYYY-MM-DD},
}

Isenção de responsabilidade

Embora o autor seja um funcionário do Google Japan, este software não é o produto do Google e não é suportado pelo Google.

Os direitos autorais deste software me pertencem, pois eu o solicitei usando o processo IARC. No entanto, o Google pode reivindicar os direitos à propriedade intelectual desta invenção.

O código é liberado sob a licença do MIT. O modelo é lançado sob a licença Internacional da Creative Commons Attribution 4.0. Consulte o arquivo readme.md no diretório data/images para obter as licenças para as imagens lá.

Expandir

Informações adicionais