Image_generation_using_stable_diffusion
Часть 1: стабильная диффузия
- Установка библиотек (библиотека Xformers для оптимизации памяти)
- Pipeline для генерации изображений: Создание подсказки -> Создание изображения -> Сохранение результата
- Создание нескольких изображений
- Параметры: Семя, Шаги вывода, шкала наведения (CFG), размер изображения (размеры), отрицательная подсказка
- Другие модели: SD V1.5, SD V2.x, тонкие модели с конкретными стилями
- Изменение планировщика: PNDM (по умолчанию), DDIM Scheduler, K-LMS Scheduler, Euler Encestral Discrete Scheduler (Euler A), DPM-планировщик
Часть 2:
- Изучение подсказок: субъект / объект, действие и местоположение, тип, стиль, цвета, художник, разрешение, сайт. И другие атрибуты: Ilumination, отрицательные подсказки
- Варианты использования: генерирование искусства, генерирование фотографий, создание ландшафтов, генерирование трехмерных изображений, генерирование чертежей, генерирование архитектур
- Улучшение результатов с использованием пользовательских моделей: что угодно (CAG/Anything-V3-1), DreamShaper (Lykon/Dreamshaper), реалистичное зрение (SG161222/Realistic_vision_v1.4), аналоговая диффузия (Wavavymulder/Analog-Diffus (Mitsua/Mitsua-Diffusion-One)
Часть 3: тонкая настройка
- Установка библиотек (Accelerate Transformers ftfy bitsandbytes == 0,35.0 Gradio natsort safetensors xformers)
- Загрузка модели
- Обучение: необходимы три компонента: уникальный идентификатор, имя класса, изображения
- Преобразовать веса в (контрольная точка)
- Вывод (тесты)
- Генерация изображений: тестирование нескольких подсказок, более быстрые примеры: в лесу, в Каире, в пустыне Каира, в западной сцене, в «Звездных войнах», в горах Фудзи, в снегу и т. Д.
- Сохранение результатов
Часть 4: изображение-изображение
- Установка библиотек (Accelerate Transformers ftfy bitsandbytes == 0,35.0 Gradio natsort safetensors xformers)
- Создание изображения
- Параметр прочности (интенсивность)
- Тестирование разных стилей
- Изменение входного изображения
- Изменение планировщика
- Изображение к изображению «Редактирование» (INSTRUCTPIX2PIX)
Часть 5: Inpainting
- Установка библиотек (Accelerate Transformers ftfy bitsandbytes == 0,35.0 Gradio natsort safetensors xformers)
- Создание подсказки
- Обменять объекты
- Сравнение результатов (другое изображение, генерирование нескольких изображений)
Часть 6: ControlNet
- Установка библиотек (ускорить трансформаторы xformers)
- Сгенерирование изображений с использованием краев (модель ControlNet + Canny Edge, обнаружение краев с использованием Canny Edge, тонкая модель)
- Генерирование изображений с использованием позов