Este projeto usa o GPT-3.5-Turbo e a difusão estável-xl-Base-1.0 e o stable-difusão-xl-refiner-1.0 para gerar histórias de dormir para crianças com ilustrações. Essas histórias podem ser lidas em voz alta para você, mostrando a imagem aprovadora em cada ponto da história.
O modelo GPT-3.5-Turbo é usado para gerar o texto da história e os avisos da imagem. Esses avisos de imagem são alimentados em modelos de difusão-xl estável para produzir as ilustrações. As histórias podem ser tocadas usando um Raspberry Pi com uma tela, embora isso não seja necessário. Ele utiliza a API do OpenAI e abraçando a biblioteca de difusores do rosto.
As modificações no projeto original incluem o uso de Stabilityai/estábulo-difusão-xl-Base-1.0 em vez da API da Deepai. O modelo é consideravelmente mais lento que outras opções, mas produz imagens melhores.
Baseado em histórias para dormir - Crie histórias ilustradas usando as APIs ChatGPT e Deepai (Difusão estável) em Python