Image_generation_using_stable_diffusion
Parte 1: difusão estável
- Instalando as bibliotecas (Biblioteca XFormers para otimização da memória)
- Oleoduto para geração de imagens: criando o prompt -> gerando a imagem -> salvando o resultado
- Gerando várias imagens
- Parâmetros: semente, etapas de inferência, escala de orientação (CFG), tamanho da imagem (dimensões), prompt negativo
- Outros modelos: SD v1.5, SD v2.x, modelos ajustados com estilos específicos
- Alterando o agendador: PNDM (padrão), DDIM Scheduler, K-LMS Scheduler, Euler Ancestral Discrete Scheduler (Euler A), DPM Scheduler
Parte 2: Engenharia rápida
- Explorando os prompts: sujeito / objeto, ação e localização, tipo, estilo, cores, artista, resolução, site. E outros atributos: iluminação, instruções negativas
- Casos de uso: geração de artes, geração de fotografias, geração de paisagens, geração de imagens 3D, geração de desenhos, geração de arquiteturas
- Melhorando os resultados usando modelos personalizados: qualquer coisa (CAG/qualquer coisa-V3-1), Dreamshaper (Lykon/Dreamshaper), Visão Realista (SG161222/realistic_vision_v1.4), Difusão analógica (MENSIMULDER/DIFFUSSÃO ANALOG), Protogen (DarkStorm2150/Protogen_X3.4_IFUSTION_OFFUSSÃO), Protogen (Darkestorm2150/Protogen_x3.4_iclder/Analog), Protogen (DarkStorm2150/Protogen_x3.4_iclder/Analog), Protogen (DarkStorm2150/Protogen_x3.4_iciums (Mitsua/Mitsua-Diffusion-One)
Parte 3: Ajuste fino
- Instalando as bibliotecas (acelere os transformadores ftfy bitsandbytes == 0.35.0 gradio Natsort SafeTetensors Xformers)
- Carregando o modelo
- Treinamento: três componentes são necessários: identificador exclusivo, nome de classe, imagens
- Converter os pesos em (ponto de verificação)
- Inferência (testes)
- Gerando imagens: testando várias instruções, exemplos mais rápidos: na floresta, no Cairo, no deserto do Cairo, em uma cena ocidental, em Guerra nas Estrelas, em Mountain Fuji, na neve, etc.
- Salvando os resultados
Parte 4: imagem a imagem
- Instalando as bibliotecas (acelere os transformadores ftfy bitsandbytes == 0.35.0 gradio Natsort SafeTensors Xformers)
- Gerando a imagem
- Parâmetro de força (intensidade)
- Testando diferentes estilos
- Alterando a imagem de entrada
- Alterando o agendador
- Imagem para imagem "Edição" (InstructPix2pix)
Parte 5: Inpainting
- Instalando as bibliotecas (acelere os transformadores ftfy bitsandbytes == 0.35.0 gradio Natsort SafeTensors Xformers)
- Criando o prompt
- Trocando os objetos
- Comparando os resultados (outra imagem, gerando várias imagens)
Parte 6: ControlNet
- Instalando as bibliotecas (acelere os transformadores Xformers)
- Gerando imagens usando bordas (Modelo ControlNet + Edge Canny, Detectando bordas usando o modelo de borda enlatada e ajustada)
- Gerando imagens usando poses