Скачать ImagenHub - загрузка исходного кода ImagenHub

ImagenHub

Другой исходный код

v0.3.0

Скачать

? ️ Imagenhub

ImagenHub: стандартизация оценки моделей условной генерации изображений
ICLR 2024

ImagenHub-это универсальная библиотека для стандартизации вывода и оценки всех моделей условной генерации изображений.

Мы определяем 7 выдающихся задач и куратор 7 высококачественных наборов данных для каждой задачи.
Мы построили унифицированный конференция для вывода, чтобы обеспечить справедливое сравнение. В настоящее время мы поддерживаем около 30 моделей.
Мы разработали две оценки оценки человека, то есть семантическую последовательность и качество восприятия, а также всеобъемлющие руководящие принципы для оценки сгенерированных изображений.
Мы предоставляем код для визуализации, автоматов и шаблонов Amazon Mechanical Turk.

[Страница проекта] [Документация] [? Arxiv] [? Наборы данных] [? ️ Imagenmuseum] [⚔ Genai-arena]

? Новости

2024 июня 10: Genai-Arena Paper вышел. Он представлен на газете Daily Daily.
2024 июня 07: Imagenhub наконец -то на PYPI! Проверьте: https://pypi.org/project/imagen-hub/
2024 апрель 07: мы выпустили оценки оценки человека в соответствии с нашей последней статьей Arxiv.
2024 февраля 14: Оформление ⚔ genai-arena ⚔: сравнительный анализ визуальных генеративных моделей в дикой природе!
2024 январь 15: бумага принята в ICLR 2024! Увидимся в Вене!
2024 январь 7: мы обновили руководство по оценке человека, представление ImagenMuseum! Теперь мы приглашаем исследователей представить свой метод на ImagenMuseum с минимальными усилиями.
2023 октябрь 23: версия 0.1.0 выпущена! Доступна документация ImagenHub!
2023 г. 19 октября: выпущен код. Документы строятся.
2023 г., 13 октября: мы выпустили музей Имагуна, страницу визуализации для всех моделей ImagenHub!
2023 г. 4 октября: наша газета представлена в Daily Daily Haggingface!
2023 октябрь 2: бумага, доступная на Arxiv. Код в ближайшее время!

? Оглавление

Установка
? ‍? Начните
Документация
? Философия
? Внося
Цитирование
? Подтверждение
? Лицензия

Установка?

Установите из PYPI:

 pip install imagen-hub

Или построить из источника:

 git clone https : // github . com / TIGER - AI - Lab / ImagenHub . git
cd ImagenHub
conda env create - f env_cfg / imagen_environment . yml
conda activate imagen
pip install - e .

Для таких моделей, как Dall-E, Dreamedit и Blipdiffusion, см. Дополнительную настройку

Для некоторых моделей (стабильная диффузия, SDXL, COSXL и т. Д.) Вам необходимо войти через huggingface-cli .

huggingface-cli login

? ‍? Начните?

Сравнительный анализ

Чтобы воспроизвести наш эксперимент, сообщенный в статье:

Пример для генерации изображений, управляемых текстами:

python3 benchmarking.py -cfg benchmark_cfg/ih_t2i.yml

Обратите внимание, что ожидаемой выходной структуры будет:

result_root_folder
└── experiment_basename_folder
    ├── input (If applicable)
    │   └── image_1.jpg ...
    ├── model1
    │   └── image_1.jpg ...
    ├── model2
    │   └── image_1.jpg ...
    ├── ...

Затем после запуска эксперимента вы можете запустить

python3 visualize.py --cfg benchmark_cfg/ih_t2i.yml

Чтобы создать файл index.html для визуализации.

Файл будет выглядеть как что -то подобное. Мы провели результаты нашего эксперимента в музее Имагуна.

Предполагая одну модель

 import imagen_hub

model = imagen_hub . load ( "SDXL" )
image = model . infer_one_image ( prompt = "people reading pictures in a museum, watercolor" , seed = 1 )
image

Заводящие метрики

 from imagen_hub . metrics import MetricLPIPS
from imagen_hub . utils import load_image , save_pil_image , get_concat_pil_images

def evaluate_one ( model , real_image , generated_image ):
  score = model . evaluate ( real_image , generated_image )
  print ( "====> Score : " , score )

image_I = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/input/sample_102724_1.jpg" )
image_O = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/DiffEdit/sample_102724_1.jpg" )
show_image = get_concat_pil_images ([ image_I , image_O ], 'h' )

model = MetricLPIPS ()
evaluate_one ( model , image_I , image_O ) # ====> Score :  0.11225218325853348

show_image

Документация?

Учебные пособия и документация по API размещены на ImagenHub.readthedocs.io.

? Философия?

Упрощив исследования и сотрудничество, ImageHub играет ключевую роль в продвижении области генерации и редактирования изображений.

Чистота оценки: мы обеспечиваем справедливую и последовательную оценку для всех моделей, устраняя смещения.
Research Roadmap: Определяя задачи и наборы данных, мы предоставляем четкое направление для исследователей.
Открытое сотрудничество: наша платформа способствует обмену и сотрудничеству связанных технологий, объединяя умы и инновации.

Внедренные модели

Мы включили более 30 моделей в синтез изображения. Смотрите полный список здесь:

Поддерживаемые модели: #1
Поддерживаемые метрики: #6

Метод	Место проведения	Тип
Стабильная диффузия	-	Поколение текста до изображения
Стабильная диффузия xl	arxiv'23	Поколение текста до изображения
DeepFloyd-if	-	Поколение текста до изображения
OpenJourney	-	Поколение текста до изображения
Далл-э	-	Поколение текста до изображения
Кандинский	-	Поколение текста до изображения
Магический размер	arxiv'23	Редактирование изображений с текстами
INSTRUCTPIX2PIX	CVPR'23	Редактирование изображений с текстами
Diffedit	ICLR'23	Редактирование изображений с текстами
Воображение	CVPR'23	Редактирование изображений с текстами
Циклевой	ICCV'23	Редактирование изображений с текстами
Sdedit	ICLR'22	Редактирование изображений с текстами
Быстро-к-продукт	ICLR'23	Редактирование изображений с текстами
Text2live	ECCV'22	Редактирование изображений с текстами
Pix2pixzero	Siggraph'23	Редактирование изображений с текстами
Скользить	ICML'22	Редактирование изображений с масками
Смешанная диффузия	CVPR'22	Редактирование изображений с масками
Стабильная диффузия внедорожника	-	Редактирование изображений с масками
Стабильная диффузия xl inpainting	-	Редактирование изображений с масками
Текстовая инверсия	ICLR'23	Объектируемое на субъекту
Блип-диффузия	arxiv'23	Объектируемое на субъекту
Dreambooth (+ Lora)	CVPR'23	Объектируемое на субъекту
Photoswap	arxiv'23	Редактирование изображений, управляемого предметом
Мечтать	arxiv'23	Редактирование изображений, управляемого предметом
Пользовательская диффузия	CVPR'23	Multi-Subject, управляемое поколением
ControlNet	arxiv'23	Управление генерацией изображений
Unicontrol	arxiv'23	Управление генерацией изображений

Комплексная функциональность

Общие показатели для Genai
Инструмент визуализации
Шаблоны Amazon Mechanical Turk (скоро)

Высококачественный стандарт разработки программного обеспечения.

Документация
Тип подсказки
Покрытие кода (скоро)

? Внести свой вклад?

Для сообщества

Вклад сообщества воодушевлен!

ImagenHub все еще находится в стадии разработки. Будет добавлено больше моделей и функций, и мы всегда приветствуем вклад, чтобы помочь сделать ImagenHub лучше. Если вы хотите внести свой вклад, пожалуйста, ознакомьтесь с Anforming.md.

Мы считаем, что каждый может внести свой вклад и изменить ситуацию. Будь то написание кода, исправление ошибок? Или просто делится обратной связью, ваши взносы определенно приветствуются и ценятся?

И если вам нравится проект, но просто у вас нет времени, чтобы внести свой вклад, это нормально. Есть и другие простые способы поддержать проект и проявить свою признательность, о которой мы также были бы очень рады:
Светь проект
Твитнуть об этом
Отправьте этот проект в Readme вашего проекта
Укажите проект на местных встречах и расскажите своим друзьям/коллегам

Для исследователей:

В: Как я могу использовать ваш метод оценки для моего метода?
A: Пожалуйста, обратитесь к https://imagenhub.readthedocs.io/en/latest/guidelines/humaneval.html
В: Как я могу добавить свой метод в кодовую базу ImagenHub?
A: Пожалуйста, обратитесь к https://imagenhub.readthedocs.io/en/latest/guidelines/customdel.html
В: Я хочу показать свой метод на ImagenMuseum!
A: Пожалуйста, обратитесь к https://imagenhub.readthedocs.io/en/latest/guidelines/imagenmuseum.html

Цитата?

Пожалуйста, обратитесь к нашей статье, если вы используете наш код, данные, модели или результаты:

 @inproceedings {
ku2024imagenhub,
title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
booktitle = { The Twelfth International Conference on Learning Representations } ,
year = { 2024 } ,
url = { https://openreview.net/forum?id=OuV9ZrkQlc }
}

 @article { ku2023imagenhub ,
  title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
  author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
  journal = { arXiv preprint arXiv:2310.01596 } ,
  year = { 2023 }
}

? Подтверждение?

Пожалуйста, обратитесь к ACKNKEDGENTIENS.MD

? Лицензия?

Этот проект выпущен под лицензией.

Звездная история?

Расширять

Дополнительная информация

Версия v0.3.0
Тип Другой исходный код
Время обновления 2025-03-07
размер 50.1MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

ImagenHub

? ️ Imagenhub

? Новости

? Оглавление

Установка?

? ‍? Начните?

Сравнительный анализ

Предполагая одну модель

Заводящие метрики

Документация?

? Философия?

Внедренные модели

Комплексная функциональность

Высококачественный стандарт разработки программного обеспечения.

? Внести свой вклад?

Для сообщества

Для исследователей:

Цитата?

? Подтверждение?

? Лицензия?

Звездная история?

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express