Dreambooth Stable Diffusion Download - Dreambooth Stable Diffusion Código fonte download

Dreambooth Stable Diffusion

Outro código-fonte

1.0.0

Baixar

Guias de instruções do Dreambooth estendidos de Yushan

Para correr em vast.ai
Para correr no Google Colab
Para executar em um PC local (Windows)
Para executar em um PC local (Ubuntu)
Adaptando o tutorial Dreambooth do Corredor Digital para o repositório de Joepenna
Usando legendas no Dreambooth de Joepenna

Índice

Notas de Joe Penna
Configurar
- Instruções fáceis do RunPod
- Configuração vast.ai
- Execute localmente
  - Venv
  - CONDA
- Referência de arquivo de configuração e linha de comando
Legendas e suporte múltiplo de sujeito/conceito
Inversão textual vs. Dreambooth
Usando o modelo gerado
Debugando seus resultados
- Eles não se parecem com você!
- Eles meio que se parecem com você, mas exatamente como suas imagens de treinamento
- Eles se parecem com você, mas não quando você tenta estilos diferentes
Abraçando difusores de rosto

O repo anteriormente conhecido como "Dreambooth"

imagem

Notas de Joe Penna

Introduções!

Oi! Meu nome é Joe Penna.

Você pode ter visto alguns meus vídeos do YouTube em Mysteryguitarman . Agora sou um diretor de longa -metragem. Você pode ter visto o Ártico ou o Stowaway.

Para meus filmes, preciso poder treinar atores, adereços, locais, etc. Então, fiz várias mudanças no repositório de @Xavierxiao para treinar o rosto das pessoas.

Não posso lançar todos os testes para o filme em que estou trabalhando, mas quando testo com meu próprio rosto, ligo -os na minha página do Twitter - @MySteryGuitarArm.

Muitos desses testes foram feitos com um amigo meu - Niko da Corridordigital. Pode ser como você encontrou este repositório!

Eu não sou realmente um codificador. Eu sou apenas teimoso e não tenho medo de pesquisar no Google. Então, eventualmente, algumas pessoas realmente inteligentes se juntaram e têm contribuído. Neste repositório, especificamente: @djbielejeski @gammagec @mrsaad - mas tantos outros em nossa discórdia!

Este não é mais o meu repositório. Este é o povo-que-wanna-veja-dreambooth-on-sd working-well's Repo!

Agora, se você quiser tentar fazer isso ... por favor, leia os avisos abaixo primeiro:

AVISO!

Vamos respeitar o trabalho duro e a criatividade das pessoas que passaram anos aprimorando suas habilidades.
- Essa iteração do Dreambooth foi projetada especificamente para artistas digitais treinarem seus próprios personagens e estilos em um modelo de difusão estável, bem como para as pessoas treinam suas próprias semelhanças. Meu principal objetivo é fazer uma ferramenta para os cineastas interagirem com artistas conceituais que eles contrataram - para gerar a semente de uma idéia inicial, para que possam se comunicar visualmente. Destinado a ser usado por cineastas, artistas conceituais, designers de quadrinhos, etc.
- Um dia, haverá uma diferença estável treinada em conjuntos de dados perfeitos. Enquanto isso, por razões morais / éticas / potencialmente legais, desencorajo fortemente o treinamento da arte de outra pessoa nesse modelo (a menos que você tenha obtido permissão explícita ou eles fizeram uma declaração pública sobre essa tecnologia). Por razões semelhantes, recomendo o uso de nomes dos artistas em seus avisos. Não coloque as pessoas que tornaram isso possível fora do trabalho!
No lado técnico:
- Agora você pode executar isso em uma GPU com 24 GB de VRAM (por exemplo, 3090). O treinamento será mais lento e você precisará ter certeza de que este é o único programa em execução.
- Se, como eu, você não possui um desses, estou incluindo um notebook Jupyter aqui para ajudá -lo a executá -lo em uma plataforma de computação em nuvem alugada.
- Atualmente é adaptado para runpod.io e vast.ai
- Também apoiamos um notebook colab:
Esta implementação não implementa totalmente as idéias do Google sobre como preservar o espaço latente.
- A maioria das imagens semelhantes ao que você está treinando será transferida para isso.
- Por exemplo, se você estiver treinando uma pessoa, todas as pessoas se parecerão com você. Se você estiver treinando um objeto, qualquer coisa nessa classe se parecerá com o seu objeto.
Não parece haver uma maneira fácil de treinar dois assuntos consecutivamente. Você acabará com um arquivo 11-12GB antes da poda.
- O caderno fornecido tem um ~2gb
A melhor prática é alterar o token para um nome de celebridade ( note: token, não classe - então seu prompt seria algo como: Chris Evans person ). Aqui está minha esposa treinou exatamente as mesmas configurações, exceto o token

Configurar

Instruções fáceis do RunPod

Nota Runpod Atualize periodicamente sua imagem básica do Docker, que pode levar ao Repo não funcionar. Nenhum dos vídeos do YouTube está atualizado, mas você ainda pode segui -los como um guia. Siga os vídeos/tutoriais típicos do Runpod YouTube, com as seguintes alterações:

De dentro da página My Pods,

Clique no botão de menu (à esquerda do botão Pray Play)
Clique em Editar Pod
Atualize "Nome da imagem do docker" para um dos seguintes (testado 2023/06/27):
- runpod/pytorch:3.10-2.0.1-120-devel
- runpod/pytorch:3.10-2.0.1-118-runtime
- runpod/pytorch:3.10-2.0.0-117
- runpod/pytorch:3.10-1.13.1-116
Clique em Salvar.
Reinicie seu pod

Continue com o restante do guia:

Inscreva -se no Runpod. Sinta -se à vontade para usar meu link de referência aqui, para que eu não precise pagar por isso (mas você o faz).
Após o login, selecione SECURE CLOUD ou COMMUNITY CLOUD
Certifique -se de encontrar uma velocidade "alta" do interior para não perder tempo e dinheiro em downloads lentos
Selecione algo com pelo menos 24 GB de VRAM como RTX 3090, RTX 4090 ou RTX A5000
Siga estas instruções de vídeo abaixo:

Instruções VAST.AI

Inscreva -se no vast.ai (links de referência de David Bielejeski)
Adicione alguns fundos (normalmente os adiciono em incrementos de US $ 10)
Navegue até o cliente - Crie página
- Selecione Pytorch/Pytorch como sua imagem do Docker e os botões "Use Jupyter Lab Interface" e "Jupyter Direct Https"
Você deseja aumentar o espaço do seu disco e filtrar na RAM da GPU (arquivos de ponto de verificação de 2 GB + 2-8 GB de arquivo de modelo + imagens de regularização + outras coisas aumentam rapidamente)
- Eu normalmente aloco 150 GB
- Também é bom verificar a velocidade de upload/download para uma largura de banda suficiente para não gastar todo o seu dinheiro esperando o download das coisas.
Selecione a instância desejada e clique em Rent , depois vá para sua página de instâncias e clique em Open
- Você receberá um aviso de certificado inseguro. Clique além do aviso ou instale o vasto certificado.
Clique Notebook -> Python 3 (você pode fazer isso na próxima etapa de várias maneiras, mas eu normalmente faço isso)
Clone Joe's Repo com este comando
- !git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion.git
- Clique em run
Navegue pelo novo diretório Dreambooth-Stable-Diffusion à esquerda e abra o arquivo dreambooth_simple_joepenna.ipynb ou dreambooth_runpod_joepenna.ipynb
Siga as instruções na pasta de trabalho e comece a treinar

Executando instruções localmente

Configuração - ambiente virtual

Pré-requisitos

Git
Python 3.10
cmd aberto
Clone o repositório
1. C:>git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion
Navegue no repositório
1. C:>cd Dreambooth-Stable-Diffusion

Instalar dependências e ativar o ambiente

cmd > python -m venv dreambooth_joepenna
cmd > dreambooth_joepennaScriptsactivate.bat
cmd > pip install torch == 1.13.1+cu117 torchvision == 0.14.1+cu117 --extra-index-url https://download.pytorch.org/whl/cu117
cmd > pip install -r requirements.txt

Correr

cmd> python "main.py" --project_name "ProjectName" --training_model "C:v1-5-pruned-emaonly-pruned.ckpt" --regularization_images "C:regularization_images" --training_images "C:training_images" --max_training_steps 2000 --class_word "person" --token "zwx" --flip_p 0 --learning_rate 1.0e-06 --save_every_x_steps 250

Limpar

cmd > deactivate

Configuração - CONDA

Pré-requisitos

Git
Python 3.10
Miniconda3
Open Anaconda Prompt (miniconda3)
Clone o repositório
1. (base) C:>git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion
Navegue no repositório
1. (base) C:>cd Dreambooth-Stable-Diffusion

Instalar dependências e ativar o ambiente

(base) C:Dreambooth-Stable-Diffusion > conda env create -f environment.yaml
(base) C:Dreambooth-Stable-Diffusion > conda activate dreambooth_joepenna

Correr

cmd> python "main.py" --project_name "ProjectName" --training_model "C:v1-5-pruned-emaonly-pruned.ckpt" --regularization_images "C:regularization_images" --training_images "C:training_images" --max_training_steps 2000 --class_word "person" --token "zwx" --flip_p 0 --learning_rate 1.0e-06 --save_every_x_steps 250

Limpar

cmd > conda deactivate

Referência de arquivo de configuração e linha de comando

Exemplo de arquivo de configuração

 {
    "class_word": "woman",
    "config_date_time": "2023-04-08T16-54-00",
    "debug": false,
    "flip_percent": 0.0,
    "gpu": 0,
    "learning_rate": 1e-06,
    "max_training_steps": 3500,
    "model_path": "D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt",
    "model_repo_id": "",
    "project_config_filename": "my-config.json",
    "project_name": "<token> project",
    "regularization_images_folder_path": "D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim",
    "save_every_x_steps": 250,
    "schema": 1,
    "seed": 23,
    "token": "<token>",
    "token_only": false,
    "training_images": [
        "001@a photo of <token> looking down.png",
        "002-DUPLICATE@a close photo of <token> smiling wearing a black sweatshirt.png",
        "002@a photo of <token> wearing a black sweatshirt sitting on a blue couch.png",
        "003@a photo of <token> smiling wearing a red flannel shirt with a door in the background.png",
        "004@a photo of <token> wearing a purple sweater dress standing with her arms crossed in front of a piano.png",
        "005@a close photo of <token> with her hand on her chin.png",
        "005@a photo of <token> with her hand on her chin wearing a dark green coat and a red turtleneck.png",
        "006@a close photo of <token>.png",
        "007@a close photo of <token>.png",
        "008@a photo of <token> wearing a purple turtleneck and earings.png",
        "009@a close photo of <token> wearing a red flannel shirt with her hand on her head.png",
        "011@a close photo of <token> wearing a black shirt.png",
        "012@a close photo of <token> smirking wearing a gray hooded sweatshirt.png",
        "013@a photo of <token> standing in front of a desk.png",
        "014@a close photo of <token> standing in a kitchen.png",
        "015@a photo of <token> wearing a pink sweater with her hand on her forehead sitting on a couch with leaves in the background.png",
        "016@a photo of <token> wearing a black shirt standing in front of a door.png",
        "017@a photo of <token> smiling wearing a black v-neck sweater sitting on a couch in front of a lamp.png",
        "019@a photo of <token> wearing a blue v-neck shirt in front of a door.png",
        "020@a photo of <token> looking down with her hand on her face wearing a black sweater.png",
        "021@a close photo of <token> pursing her lips wearing a pink hooded sweatshirt.png",
        "022@a photo of <token> looking off into the distance wearing a striped shirt.png",
        "023@a photo of <token> smiling wearing a blue beanie holding a wine glass with a kitchen table in the background.png",
        "024@a close photo of <token> looking at the camera.png"
    ],
    "training_images_count": 24,
    "training_images_folder_path": "D:\stable-diffusion\training_images\24 Images - captioned"
}

Usando sua configuração para treinamento

 python "main.py" --config_file_path "path/to/the/my-config.json"

Parâmetros da linha de comando

Dreambooth_helpers argumentos.py

Comando	Tipo	Exemplo	Descrição
`--config_file_path`	corda	`"C:\Users\David\Dreambooth Configs\my-config.json"`	O caminho do arquivo de configuração para usar
`--project_name`	corda	`"My Project Name"`	Nome do projeto
`--debug`	bool	`False`	Padrões opcionais para `False` . Ativar log de depuração
`--seed`	int	`23`	Padrões opcionais para `23` . Semente para semente_everything
`--max_training_steps`	int	`3000`	Número de etapas de treinamento para executar
`--token`	corda	`"owhx"`	Token exclusivo Você deseja representar seu modelo treinado.
`--token_only`	bool	`False`	Padrões opcionais para `False` . Treine apenas usando o token e nenhuma classe.
`--training_model`	corda	`"D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt"`	Caminho para modelo para treinar (Model.ckpt)
`--training_images`	corda	`"D:\stable-diffusion\training_images\24 Images - captioned"`	Caminho para o treinamento do diretório de imagens
`--regularization_images`	corda	`"D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim"`	Caminho para diretório com imagens de regularização
`--class_word`	corda	`"woman"`	Combine o Class_word com a categoria de imagens que você deseja treinar. Exemplo: `man` , `woman` , `dog` ou `artstyle` .
`--flip_p`	flutuador	`0.0`	Padrões opcionais para `0.5` . Porcentagem de flip. Exemplo: se definido como `0.5` , virará (espelhará) suas imagens de treinamento 50% do tempo. Isso ajuda a expandir seu conjunto de dados sem precisar incluir mais imagens de treinamento. Isso pode levar a resultados piores para o treinamento de rosto, pois os rostos da maioria das pessoas não são perfeitamente simétricos.
`--learning_rate`	flutuador	`1.0e-06`	Padrões opcionais para `1.0e-06` (0,000001). Defina a taxa de aprendizado. Aceita notação científica.
`--save_every_x_steps`	int	`250`	Padrões opcionais para `0` . Economiza um ponto de verificação a cada x etapas. AS `0` Salva apenas no final do treinamento quando `max_training_steps` é alcançado.
`--gpu`	int	`0`	Padrões opcionais para `0` . Especifique uma GPU diferente de 0 a ser usada para treinamento. O suporte a multi-GPU não é implementado no momento.

Usando sua configuração para treinamento

 python "main.py" --project_name "My Project Name" --max_training_steps 3000 --token "owhx" --training_model "D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt" --training_images "D:\stable-diffusion\training_images\24 Images - captioned" --regularization_images "D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim" --class_word "woman" --flip_p 0.0 --save_every_x_steps 500

Legendas e suporte múltiplo de sujeito/conceito

Legendas são suportadas. Aqui está o guia sobre como os implementamos.

Digamos que seu token é efy e sua classe é pessoa, sua raiz de dados é /trem então:

training_images/img-001.jpg é legenda com effy person

Você pode personalizar a legenda adicionando -o após um símbolo @ no nome do arquivo.

/training_images/img-001@a photo of effy => a photo of effy

Você pode usar dois tokens em suas legendas S - SPERCASE S - e C - OUPERCASE C - para indicar sujeito e classe.

/training_images/img-001@S being a good C.jpg => effy being a good person

Para criar um novo assunto, você só precisa criar uma pasta para ele. Então:

/training_images/bingo/img-001.jpg => bingo person

A classe permanece a mesma, mas agora o assunto mudou.

Novamente - o token s agora é bingo:

/training_images/bingo/img-001@S is being silly.jpg => bingo is being silly

Uma pasta mais profunda e você pode alterar a classe: /training_images/bingo/dog/img-001@S being a good C.jpg => bingo being a good dog

Não vem o kicker: um nível mais profundo e você pode legendar o grupo de imagens: /training_images/effy/person/a picture of/img-001.jpg => a picture of effy person

Inversão textual vs. Dreambooth

A maior parte do código neste repo foi escrita por Rinon Gal et. Al, os autores do artigo de pesquisa de inversão textual. Embora algumas idéias sobre imagens de regularização e preservação de perdas anteriores (idéias de "Dreambooth") tenham sido adicionadas, por respeito à equipe do MIT e aos pesquisadores do Google, estou renomeando esse garfo para: "O repo anteriormente conhecido como" Dreambooth "" .

Para uma implementação alternativa, consulte "Opção alternativa" abaixo.

Usando o modelo gerado

A ground truth (imagem real, cautela: mulher muito bonita)

Mesmo aviso para todas essas imagens abaixo:

`sks person`	`woman person`	`Natalie Portman person`	`Kate Mara person`

Debugando seus resultados

❗❗ O erro número um que as pessoas cometem ❗❗

Solicitando apenas com seu token. ou seja, "Joepenna" em vez de "Joepenna Pessoa"

Se você treinou com joepenna sob a person da classe, o modelo só deve conhecer seu rosto como:

 joepenna person

Exemplo de aviso:

Incorreto ( person desaparecida seguindo joepenna )

 portrait photograph of joepenna 35mm film vintage glass

✅ Isso está certo ( person está incluída após joepenna )

 portrait photograph of joepenna person 35mm film vintage glass

Às vezes, você pode conseguir alguém que meio que se parece com você com Joepenna (especialmente se você treinou para muitos passos), mas isso é apenas porque essa iteração atual de Dreambooth Treerave que o token tanto que sangra nesse token.

☢ Cuidado com os tipos de imagens que você treina

Durante o treinamento, estável não sabe que você é uma pessoa. Só vai imitar o que vê.

Então, se essas são suas imagens de treinamento, se parecem:

Você só vai conseguir gerações de você do lado de fora ao lado de uma árvore espetada, vestindo uma camisa branca e cinza, no estilo de ... bem, fotografia de selfie.

Em vez disso, esse conjunto de treinamento é muito melhor:

A única coisa que é consistente entre as imagens é o assunto. Portanto, estável examinará as imagens e aprenderá apenas o seu rosto, o que tornará possível "editar" em outros estilos.

Oh não! Você não está recebendo boas gerações!

Opção 1: eles não estão parecendo nada! (Treine mais ou obtenha melhores imagens de treinamento)

Tem certeza de que está solicitando certo?

Deve ser <token> <class> , não apenas <token> . Por exemplo:

JoePenna person, portrait photograph, 85mm medium format photo

Se ainda não se parece com você, você não treinou o suficiente.

Opção 2: Eles estão parecendo com você, mas todos parecem suas imagens de treinamento. (Treine para menos etapas, obtenha melhores imagens de treinamento, conserte com promoção)

Ok, algumas razões: você pode ter treinado muito tempo ... ou suas imagens eram muito semelhantes ... ou você não treinou com imagens suficientes.

Sem problemas. Podemos consertar isso com o prompt. A difusão estável coloca muito mérito para o que você digitar primeiro. Portanto, salve para mais tarde:

an exquisite portrait photograph, 85mm medium format photo of JoePenna person with a classic haircut

Opção 3: Eles estão se parecendo com você, mas não quando você tenta estilos diferentes. (Treine mais, obtenha melhores imagens de treinamento)

Você não treinou o suficiente ...

Sem problemas. Podemos consertar isso com o prompt:

JoePenna person in a portrait photograph, JoePenna person in a 85mm medium format photo of JoePenna person

Mais dicas e ajuda aqui: Difusão estável Dreambooth Discord

Abraçando difusores de rosto - opção alternativa

O Dreambooth agora é suportado em difusores Huggingface para treinamento com difusão estável.

Experimente aqui:

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-02-25
tamanho 14.09MB
Vindo de Github

Aplicativos Relacionados

stable diffusion webui forge

2024-11-08
GitHub sgrebnov/cordova plugin background download

2024-11-05
krita ai diffusion

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
stable diffusion webui

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos