In diesem Projekt wird GPT-3.5-Turbo und Stabil-Diffusion-XL-Base-1.0 & Stable-Diffusion-XL-Refininer-1.0 verwendet, um Kinderschlafengeschichten mit Illustrationen zu generieren. Diese Geschichten können dann für Sie laut gelesen werden, während Sie an jedem Punkt der Geschichte das aufgeladene Bild zeigen.
Das GPT-3.5-Turbo-Modell wird verwendet, um den Story-Text und die Bildaufforderungen zu generieren. Diese Bildaufforderungen werden in stabile Diffusion-XL-Modelle eingespeist, um die Abbildungen zu erstellen. Die Geschichten können mit einem Raspberry Pi mit einem Display gespielt werden, obwohl dies nicht erforderlich ist. Es verwendet Openais API und umarmte die Diffusors -Bibliothek von Face.
Modifikationen am ursprünglichen Projekt umfassen die Verwendung von Stabilitätsheil-/Stabil-Diffusion-XL-Base-1.0 und nicht die API von Deepai. Das Modell ist wesentlich langsamer als andere Optionen, erzeugt aber bessere Bilder.
Basierend auf Gutenachtgeschichten - Erstellen Sie illustrierte Geschichten mit den APIs Chatgpt und Deepai (Stable Diffusion) in Python