Obtendo as versões mais recentes da difusão de disco (no momento da redação, isso é V5 com a animação turbo e 3D) funcionar localmente, em vez de colab. Incluindo como eu corro isso no Windows, apesar de algumas dependências apenas do Linux;). Agora inclui um modo de lote experimental para criar quantos vídeos desejar com instruções diferentes, com apenas 1 execução.
Se você tiver algum problema, sinta -se à vontade para abrir um problema e farei o possível para ajudar a solucionar problemas. Ser o mais específico possível. Por exemplo, se você receber uma mensagem de erro em qualquer momento, precisará incluir isso no problema, juntamente com o sistema operacional e as especificações do computador.





As mesmas etapas devem funcionar no Linux, a partir da etapa 3.
Requisitos:
Windows 11: Windows 11 deve funcionar, mas não dói atualizar para a versão mais recente antes de continuar :) (Note que eu criei e testei isso no Windows 10) Windows 10: você deve estar executando pelo menos a atualização do recurso 21H2 para sua GPU funcionar. Para verificar qual versão você está executando, abra CMD e digite:
winver
Se você estiver em 21h2 ou mais tarde, está pronto para ir. Caso contrário, tente atualizar o Windows digitando "Verifique se há atualizações" no menu Iniciar e usar a ferramenta embutida. Para mim, pessoalmente, a atualização necessária não estava sendo exibida, mas consegui instalá -la usando o Assistente de Atualização do Windows 10.
A maneira como usaremos apenas as dependências do Linux é instalando a versão mais recente do subsistema Windows para Linux (WSL2). Isso executará uma máquina virtual - como a instalação do Ubuntu no Windows. No entanto, a Microsoft implementou isso em um nível muito baixo, o que significa que quase nenhum desempenho de desempenho e suporte da GPU!
Para obter as instruções mais recentes sobre isso, siga o guia oficial da Microsoft.
Resumidamente, basta abrir um Windows PowerShell como administrador e tipo:
wsl —-install
Ele pode solicitar uma reinicialização e, quando você reiniciar o computador, terá um aplicativo no menu Iniciar ou na barra de tarefas chamado "Ubuntu"!
Precisamos instalar o Anaconda dentro do nosso ambiente do Ubuntu para gerenciar pacotes facilmente. Abra seu novo aplicativo do Ubuntu (e corrija todos os erros que surgirem no primeiro lançamento. Eu tinha alguns, mas eles foram auto -explicativos ou fixa facilmente com um Google rápido). Agora você deseja baixar e executar o instalador do Linux Anaconda, como segue. Se você estiver seguindo isso muito mais tarde em março de 2022, poderá substituir o URL abaixo pela versão mais recente do site da Anaconda.
mkdir Downloads
cd Downloads
wget https://repo.anaconda.com/archive/Anaconda3-2021.11-Linux-x86_64.sh
bash Anaconda3-2021.11-Linux-x86_64.sh
Siga as instruções na tela. Ou seja, digite sim quando ele pede e pede e solicita que você execute o conda init quando solicitado.
Feche seu terminal do Ubuntu e abra -o novamente.
Agora digite e corra
conda —-help
Se fornecer uma longa lista de opções do CoNA, isso significa que é instalada com sucesso ANACONDA dentro do Ubuntu!
Agora, criaremos e ativamos um ambiente do CONDA (dentro do Ubuntu) com todas as dependências apropriadas.
conda create -n pytorch_110
conda activate pytorch_110
Sempre que você reinicia o computador, ou feche e abra o Ubuntu novamente, você terá que executar esse segundo comando (o CONDA Ative Pytorch). Agora instale a versão correta do Pytorch:
conda install pytorch==1.10 torchvision torchaudio cudatoolkit==11.1 -c pytorch -c conda-forge
Tipo y sempre que solicitado.
Encontrar o exposto acima levou muitas tentativas e erros. A dificuldade era encontrar uma combinação de Pytorch e Cudatoolkit que funcione com Pytorch3D (exigido posteriormente). O acima funcionou para mim.
Agora instale algumas outras dependências:
conda install jupyter pandas requests matplotlib
conda install opencv -c conda-forge
Opção 1 de como realmente executar o código e obter imagens / vídeo. A opção 1 envolve o download de um .ipynb, que é levemente modificado no notebook Colab, editando células e editando -as dentro do ambiente de notebooks.
Trabalharemos dentro de uma versão de notebook Jupyter do notebook Colab. (Atualmente, estou trabalhando em uma interface mais limpa, certifique -se de estrear e assistir ao repositório para ver quando isso for lançado).
Faça o download do notebook Jupyter neste repositório. Se você sabe como, clone o repo diretamente em sua distribuição do Ubuntu. Para tornar este guia o mais fácil de seguir, também mostrarei uma maneira mais fácil.
No seu terminal Ubuntu, tipo:
explorer.exe .
Isso abrirá seu diretório Ubuntu no Windows Explorer! Encontre um local para o qual deseja baixar o notebook, talvez crie uma nova pasta para ele.
No meu repositório do GitHub, clique em "Code" e faça o download do zip. Extraia o zip e copie o arquivo .ipynb para a pasta desejada no Ubuntu . Se tiped explorer.exe anteriormente, você terá uma pasta Ubuntu aberta no Explorer, para que você possa arrastar e soltar nesta pasta.
No seu terminal Ubuntu, execute:
jupyter notebook
Você pode notar que isso não abre automaticamente o Jupyter no seu navegador. Tudo bem! Basta procurar o URL começando com localhost, copie isso e cole -o no navegador no Windows.
Isso deve abrir Jupyter no seu navegador! Agora navegue até a pasta onde você colocou seu notebook Jupyter e abra -o. Execute as células, uma a uma. Eles devem instalar dependências necessárias adicionais e baixar todos os modelos para você. Ao longo do caminho, você pode alterar as configurações que desejar. Uma das últimas células pede "text_prompts", que você pode especificar para criar o que quiser!
Opção 2 de como realmente executar o código e obter imagens / vídeo. Isso envolve a configuração de uma pasta com arquivos de configurações, que o notebook funcionará até 1 por 1. Isso permitirá que você especifique os prompts para tantos vídeos diferentes quanto desejar e criar todos com uma única execução de um notebook.
Algumas opções devem ser especificadas uma vez e serão usadas para todos os itens na fila. Defina -os em "fila/master_settings.txt":
As opções que podem ser especificadas para cada vídeo são as seguintes. Deve ser especificado em "fila/fileue_1.txt", "fila/fileue_2.txt" etc. Os arquivos podem ser criados enquanto o script está em execução, sem interrupção!
Observe que atualmente é experimental e destinado a criar uma série de vídeos (não imagens). Você pode enviar problemas para solicitações de bugs / recursos, ou mesmo suas próprias solicitações de tração, se quiser melhorar isso;)
Além disso, para meus usos, corrigir todos esses recursos funciona bem. Se houver recursos que você gostaria de alterar entre as execuções na fila que você não pode atualmente, sinta -se à vontade para iniciar uma solicitação de problema ou puxar.
Clone o repo na sua instalação do Ubuntu. Se você não sabe como fazer isso, clique em "Code" e "Baixe Zip" neste repositório. Copie todo o repositório em uma pasta em seu ambiente do Ubuntu. Isso geralmente está em algum lugar como " wsl $ ubuntu home nome de usuário". Você pode acessá -lo facilmente digitando explorer.exe. na sua janela do Ubuntu.
Uma das pastas que você copiou deve ser chamada de "fila". Abra isso e especifique quais configurações você deseja em "master_settings". Em seguida, especifique o que você deseja em cada vídeo, em arquivos separados nesta mesma pasta. Eles devem nomear "Queue_1.txt" em diante, sem lacunas.
Você pode sintetizar os arquivos da fila da linha de comando, simplesmente navegar até o repositório clonado e digitar:
jupyter nbconvert --execute --to notebook --inplace Disco_Diffusion_v5_2_w_VR_Mode_batch_mode.ipynb
O acima será executado todas as células no notebook Jupyter na linha de comando. Você também pode executá -los em Jupyter, se preferir. Consulte a opção 1 para obter instruções sobre como executar o notebook Jupyter, se desejar.
Deve ser isso! Isso deve começar a criar imagens na sua fila, 1 por 1.
Estou recebendo erros de CUDA.
RuntimeError: Erro do CUDA: Erro desconhecido Os erros do kernel do CUDA podem ser relatados de forma assíncrona em alguma outra chamada da API, para que o Stacktrace abaixo possa estar incorreto. Para depuração, considere passar CUDA_LAUNCH_BLOCKING = 1.
Se você está recebendo um erro como o acima, eu só soube que isso acontece se você estiver usando muito VRAM. Reduzindo fazendo 1 ou todos os seguintes:
Se isso funcionar, adicione lentamente os modelos e aumente a resolução até descobrir onde está o limite para a sua GPU.