Image_generation_using_stable_diffusion
Parte 1: Difusión estable
- Instalación de las bibliotecas (biblioteca Xformers a la optimización de memoria)
- Tubería para la generación de imágenes: creación del indicador -> Generación de la imagen -> Guardar el resultado
- Generando múltiples imágenes
- Parámetros: semilla, pasos de inferencia, escala de orientación (CFG), tamaño de imagen (dimensiones), aviso negativo
- Otros modelos: SD V1.5, SD v2.x, modelos ajustados con estilos específicos
- Cambio del Programador: PNDM (predeterminado), DDIM Scheduler, K-LMS Scheduler, Euler Ancestral Discreter Scheduler (Euler A), DPM Scheduler
Parte 2: Ingeniería rápida
- Explorando las indicaciones: sujeto / objeto, acción y ubicación, tipo, estilo, colores, artista, resolución, sitio. Y otros atributos: iluminación, indicaciones negativas
- Casos de uso: Generación de artes, generar fotografías, generar paisajes, generar imágenes 3D, generar dibujos, generar arquitecturas
- Improving the results using custom models: Anything (cag/anything-v3-1), DreamShaper (Lykon/DreamShaper), Realistic Vision (SG161222/Realistic_Vision_V1.4), Analog Diffusion (wavymulder/Analog-Diffusion), Protogen (darkstorm2150/Protogen_x3.4_Official_Release), Mitsua Diffusion One (Mitsua/Mitsua-Diffusion-One)
Parte 3: ajuste fino
- Instalación de las bibliotecas (acelerar transformadores ftfy bitsandbytes == 0.35.0 Gradio Natsort Safetensors Xformers)
- Cargando el modelo
- Capacitación: se necesitan tres componentes: identificador único, nombre de clase, imágenes
- Convierta los pesos en (punto de control)
- Inferencia (pruebas)
- Generación de imágenes: Prueba de múltiples indicaciones, más ejemplos rápidos: en el bosque, en El Cairo, en el desierto de El Cairo, en una escena occidental, en Star Wars, en Mountain Fuji, en la nieve, etc.
- Guardar los resultados
Parte 4: Imagen a imagen
- Instalación de las bibliotecas (acelerar transformadores ftfy bitsandbytes == 0.35.0 Gradio Natsort Safetensors Xformers)
- Generando la imagen
- Parámetro de resistencia (intensidad)
- Prueba de diferentes estilos
- Cambiar la imagen de entrada
- Cambiar el planificador
- Imagen a imagen "Edición" (InstructPix2Pix)
Parte 5: Inpenación
- Instalación de las bibliotecas (acelerar transformadores ftfy bitsandbytes == 0.35.0 Gradio Natsort Safetensors Xformers)
- Creando el aviso
- Intercambiando los objetos
- Comparación de los resultados (otra imagen, generar múltiples imágenes)
Parte 6: Controlnet
- Instalación de las bibliotecas (acelerar transformers xformers)
- Generación de imágenes utilizando bordes (modelo Controlnet + bordes canny, detectar bordes con bordes canny, modelo ajustado)
- Generando imágenes usando poses