Image_generation_using_stable_diffusion
Partie 1: Diffusion stable
- Installation des bibliothèques (bibliothèque XFormers à l'optimisation de la mémoire)
- Pipeline pour la génération d'images: création de l'invite -> Génération de l'image -> Enregistrer le résultat
- Générer plusieurs images
- Paramètres: graines, étapes d'inférence, échelle de guidage (CFG), taille de l'image (dimensions), invite négative
- Autres modèles: SD V1.5, SD V2.x, modèles affinés avec des styles spécifiques
- Modification du planificateur: PNDM (par défaut), planificateur DDIM, planificateur K-LMS, planificateur discret Ancestral Euler (Euler A), planificateur DPM
Partie 2: ingénierie rapide
- Exploration des invites: sujet / objet, action et emplacement, type, style, couleurs, artiste, résolution, site. Et autres attributs: ilumination, invites négatives
- Cas d'utilisation: générer des arts, générer des photographies, générer des paysages, générer des images 3D, générer des dessins, générer des architectures
- Amélioration des résultats en utilisant des modèles personnalisés: n'importe quoi (CAG / NOYE-V3-1), Dreamshaper (Lykon / Dreamshaper), Realist Vision (SG161222 / Realist_Vision_V1.4), Diffusion analogique (WavyMulder / Analog-Diffusion), Protogen (Darkstorm2150 / Protogen_X3.4_Official_Release), Mitua Confusion One One One One One (Mitsua / Mitsua-Diffusion-one)
PARTIE 3: Fonctionnement
- Installation des bibliothèques (accélérer les transformateurs ftfy bitsandbytes == 0,35,0 Gradio Natsort Safettensers XFORMERS)
- Chargement du modèle
- Formation: trois composants sont nécessaires: identifiant unique, nom de classe, images
- Convertir les poids en (point de contrôle)
- Inférence (tests)
- Génération d'images: tester plusieurs invites, plus d'exemples rapides: dans la forêt, au Caire, dans le désert du Caire, dans une scène occidentale, à Star Wars, à Mountain Fuji, dans la neige, etc.
- Sauver les résultats
Partie 4: image à l'image
- Installation des bibliothèques (accélérer les transformateurs ftfy bitsandbytes == 0,35,0 Gradio Natsort Safettensers XFORMERS)
- Générer l'image
- Paramètre de résistance (intensité)
- Tester différents styles
- Modification de l'image d'entrée
- Changer le planificateur
- Image à l'image "Édition" (instructPix2Pix)
Partie 5: Inspérimentation
- Installation des bibliothèques (accélérer les transformateurs ftfy bitsandbytes == 0,35,0 Gradio Natsort Safettensers XFORMERS)
- Créer l'invite
- L'échange des objets
- Comparaison des résultats (autre image, générant plusieurs images)
Partie 6: ControlNet
- Installation des bibliothèques (accélérer les transformateurs xformateurs)
- Génération d'images à l'aide de bords (ControlNet Model + Canny Edge, détectant les bords à l'aide d'un bord de pointe, modèle fin)
- Générer des images à l'aide de poses