Скачать Palette Image to Image Diffusion Models - Palette Image to Image Diffusion Models Скачать исходный код

Palette Image to Image Diffusion Models

Питон

1.0.0

Скачать

Палитра: диффузионные модели изображения до изображения

Бумага | Проект

Краткий

Это неофициальная реализация палитры: диффузионные модели с изображением от Pytorch , и в основном она наследуется от версии в супер разрешении изображения-резолюция-виа-утечка. Шаблон кода взят из моего другого начального проекта: распределенный пирог-типремат.

Есть некоторые детали реализации с описаниями бумаги:

Мы адаптировали архитектуру U-Net, используемой в Guided-Diffusion , что дает существенный импульс для качества выборки.
Мы использовали механизм внимания в особенностях низкого разрешения (16 × 16), как ванильный DDPM .
Мы кодируем $ gamma $ скорее, чем $ t $ в Palette и встройте его с аффинной трансформацией.
Мы исправляем дисперсию $ Σ_ theta (x_t, t) $ постоянно во время вывода, как описано в Palette .

Статус

Код

Диффузионный модельный трубопровод
Поезд/процесс тестирования
Сохранить/загрузить состояние обучения
Logger/Tensorboard
Многочисленное обучение графического процессора (DDP)
Эма
Метрики (теперь для FID, есть)
Набор данных (теперь для внедрения, непредвиденного, раскраски)
Google Colab Script? (Теперь для Inpainting)

Задача

Я пытаюсь закончить следовать задачам в порядке:

Inpainting на Celebahq (Google Colab)
Внедрение на местах2 с 128 × 128 -центрирующей маской

Последующий эксперимент неопределен из-за отсутствия времени и ресурсов графического процессора:

Непрерывность на местах2
Окрашение на набор ImageNet Val

Результаты

Модель DDPM требует значительных вычислительных ресурсов, и мы создали только несколько примеров моделей для проверки идей в этой статье.

Визуальные эффекты

Celeba-HQ

Результаты с 200 эпохами и итерациями 930 тысяч, и первые 100 образцов в центрирующей маске и нерегулярной маске.

Places2 с 128 × 128 -центрирующей маской

Результаты с 16 эпохами и итерациями 660 тысяч, и несколькими выбранными образцами в центрирующей маске.

Непрерывность на местах2

Результаты с 8 эпохами и итерациями 330 тысяч, и несколькими выбранными образцами в непредвиденных.

Метрики

Задачи	Набор данных	Эма	Фид (-)	IS (+)
Внедрение с центрирующей маской	Celeba-HQ	ЛОЖЬ	5.7873	3.0705
Внедрение с нерегулярной маской	Celeba-HQ	ЛОЖЬ	5.4026	3.1221

Использование

Среда

 pip install - r requirements . txt

Предварительно обученная модель

Набор данных	Задача	Итерации	Графические процессоры × дней × bs	URL
Celeba-HQ	Внедрение	930K	2 × 5 × 3	Google Drive
Места2	Внедрение	660K	4 × 8 × 10	Google Drive

BS указывает размер выборки на GPU.

Данные подготовлены

Мы получаем большинство из них от Kaggle, что может немного отличаться от официальной версии, и вы также можете загрузить их с официального сайта.

Celeba-HQ Изменение (256x256) kaggle
МЕСТО2 Официальные | МЕСТО2 КАГГЛ
ImageNet Official

Мы используем разделение по умолчанию этих наборов данных для обучения и оценки. Списки файлов, которые мы используем, можно найти в Celeba-HQ, Place2.

После того, как вы подготовили свои данные, вам необходимо изменить соответствующий файл Configure, чтобы указывать на ваши данные. Возьмите следующее в качестве примера:

 " which_dataset " : {  // import designated dataset using arguments 
    " name " : ["data.dataset", "InpaintDataset"], // import Dataset() class
    " args " :{ // arguments to initialize dataset
    	" data_root " : " your data path " ,
    	" data_len " : -1,
    	" mask_mode " : " hybrid "
    } 
},

Дополнительные варианты DataLoader и разделения валидации также можно найти в datasets в части настройки файла.

Обучение/резюме обучение

Загрузите контрольно -пропускные пункты по данным ссылок.
Установите resume_state файла настройки в каталог предыдущей контрольной точки. Возьмите следующее в качестве примера, этот каталог содержит учебные состояния и сохраненную модель:

 " path " : { //set every part file path
	" resume_state " : "experiments/inpainting_celebahq_220426_150122/checkpoint/100" 
},

Установите свою сетевую метку в функцию load_everything of model.py , по умолчанию - это сеть . Следуйте настройкам учебника, оптимизаторы и модели будут загружены из 100.State и 100_network.pth соответственно.

 netG_label = self . netG . __class__ . __name__
self . load_network ( network = self . netG , network_label = netG_label , strict = False )

Запустите сценарий:

 python run . py - p train - c config / inpainting_celebahq . json

Мы проверяем магистраль U-NET, используемую в SR3 и Guided Diffusion , и Guided Diffusion которая имеет более надежную производительность в наших текущих экспериментах. Можно найти больше вариантов выбора в отношении основных целей , потери и метрики, в which_networks часть файла настройки.

Тест

Измените файл Configure, чтобы указать на ваши данные после шагов в детали данных .
Установите свой путь модели, следуя этапам обучения резюме .
Запустите сценарий:

 python run . py - p test - c config / inpainting_celebahq . json

Оценка

Создайте две папки, сохраняющие изображения истины и примеры образцов, и их имена файлов должны соответствовать друг другу.
Запустите сценарий:

 python eval . py - s [ ground image path ] - d [ sample image path ]

Сознавать

Наша работа основана на следующих теоретических работах:

Обезвреживание диффузионных вероятностных моделей
Палитра: диффузионные модели изображения до изображения
Диффузионные модели бьют Gans по синтезу изображения

И мы получаем большую пользу от следующих проектов:

Openai/Guided-Diffusion
Louisrouss/Diffusion-Model-For-Colorization

Расширять

Дополнительная информация

Версия 1.0.0
Тип Питон
Время обновления 2025-07-14
размер 5.89MB
От Github

Связанные приложения

pytorch image models

2024-11-03
галерея изображений моа

2011-09-14
Хост изображений CF

2011-04-26
Хост изображений CF

2011-04-26
Изменение размера изображения VSO

2009-06-04
Плагин «Суперизображение»

2009-04-18

Palette Image to Image Diffusion Models

Палитра: диффузионные модели изображения до изображения

Краткий

Статус

Код

Задача

Результаты

Визуальные эффекты

Celeba-HQ

Places2 с 128 × 128 -центрирующей маской

Непрерывность на местах2

Метрики

Использование

Среда

Предварительно обученная модель

Данные подготовлены

Обучение/резюме обучение

Тест

Оценка

Сознавать

pytorch image models

галерея изображений моа

Хост изображений CF

Хост изображений CF

Изменение размера изображения VSO

Плагин «Суперизображение»

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express