Image_generation_using_stable_diffusion
Teil 1: Stabile Diffusion
- Installieren der Bibliotheken (Xformers Library an Speicheroptimierung)
- Pipeline für die Bildgenerierung: Erstellen der Eingabeaufforderung -> das Bild erstellen -> das Ergebnis speichern
- Mehrere Bilder erzeugen
- Parameter: Saatgut, Inferenzschritte, Leitskala (CFG), Bildgröße (Abmessungen), negative Eingabeaufforderung
- Andere Modelle: SD V1.5, SD v2.x, fein abgestimmte Modelle mit spezifischen Stilen
- Ändern des Schedulers: PNDM (Standard), DDIM Scheduler, K-LMS Scheduler, Euler Ancestrete Discrete Scheduler (Euler A), DPM Scheduler
Teil 2: Schnelltechnik
- Erforschen der Eingabeaufforderungen: Subjekt / Objekt, Aktion und Ort, Typ, Stil, Farben, Künstler, Auflösung, Site. Und andere Attribute: Ilumination, negative Eingabeaufforderungen
- Anwendungsfälle: Erzeugung von Künsten, Erzeugen von Fotografien, Erzeugen von Landschaften, Erzeugen von 3D -Bildern, Erzeugen von Zeichnungen, Erzeugen von Architekturen
- Improving the results using custom models: Anything (cag/anything-v3-1), DreamShaper (Lykon/DreamShaper), Realistic Vision (SG161222/Realistic_Vision_V1.4), Analog Diffusion (wavymulder/Analog-Diffusion), Protogen (darkstorm2150/Protogen_x3.4_Official_Release), Mitsua Diffusion One (Mitsua/Mitsua-Diffusion-One)
Teil 3: Feinabstimmung
- Installation der Bibliotheken (Beschleunigung von Transformatoren ftfy bitsandbytes == 0,35.0 Gradio Natsort Safetensoren Xformers)
- Laden des Modells
- Training: Drei Komponenten werden benötigt: Eindeutige Kennung, Klassenname, Bilder
- Konvertieren Sie die Gewichte in (Checkpoint)
- Inferenz (Tests)
- Bilder erzeugen: Testen Sie mehrere Eingabeaufforderungen, schnelle Beispiele: Im Wald, in Kairo, in Kairo -Wüste, in einer westlichen Szene, in Star Wars, in Mountain Fuji, im Schnee usw.
- Sparen der Ergebnisse
Teil 4: Bild-zu-Image
- Installation der Bibliotheken (Beschleunigung von Transformatoren ftfy bitsandbytes == 0,35.0 Gradio Natsort Safetensoren Xformers)
- Erzeugen des Bildes
- Festigkeitsparameter (Intensität)
- Testen verschiedener Stile
- Ändern des Eingangsbildes
- Ändern des Schedulers
- Bild zum Bild "Bearbeitung" (InstructPix2Pix)
Teil 5: Inpainting
- Installation der Bibliotheken (Beschleunigung von Transformatoren ftfy bitsandbytes == 0,35.0 Gradio Natsort Safetensoren Xformers)
- Erstellen der Eingabeaufforderung
- Austausch der Objekte
- Vergleichen Sie die Ergebnisse (anderes Bild, mehrere Bilder generieren)
Teil 6: ControlNet
- Installation der Bibliotheken (Beschleunigung von Transformatoren Xformers)
- Erzeugen von Bildern mit Kanten (ControlNET-Modell + Canny Edge, Erkennung von Kanten mit Canny Edge, feinstimmigem Modell)
- Bilder mithilfe von Posen generieren