В этом проекте используется GPT-3.5-Turbo и Stable-Diffusion-xl-base-1.0 & Stable-Diffusion-xl-Refiner-1.0, чтобы создать детские истории перед сном с иллюстрациями. Эти истории могут быть прочитаны вслух для вас, показывая вам соответствующее изображение в каждой точке истории.
Модель GPT-3.5-Turbo используется для создания текста истории и подсказок изображения. Эти подсказки изображения подаются в модели стабильной диффузии-XL для производства иллюстраций. Истории можно сыграть, используя Raspberry Pi с дисплеем, хотя это не требуется. Он использует API API Openai и библиотеку Diffusers Hearging Face.
Модификации оригинального проекта включают в себя использование Stabalityai/Stable-Diffusion-xl-base-1.0, а не API Дипаи. Модель значительно медленнее, чем другие варианты, но создает лучшие изображения.
Основываясь на рассказах перед сном - Создайте иллюстрированные истории, используя API CATGPT и Diepai (стабильная диффузия) в Python