Descargar ImagenHub - Descargar el código fuente de ImagenHub

ImagenHub

Otro código fuente

v0.3.0

Descargar

? ️ Imagenhub

ImagenHub: Estandarización de la evaluación de modelos condicionales de generación de imágenes
ICLR 2024

ImagenHub es una biblioteca única para estandarizar la inferencia y evaluación de todos los modelos de generación de imágenes condicionales.

Definimos 7 tareas prominentes y cuestionamos 7 conjuntos de datos de evaluación de alta calidad para cada tarea.
Construimos una tubería de inferencia unificada para garantizar una comparación justa. Actualmente apoyamos alrededor de 30 modelos.
Diseñamos dos puntajes de evaluación humana, es decir, consistencia semántica y calidad perceptiva, junto con pautas integrales para evaluar las imágenes generadas.
Proporcionamos código para la visualización, las plantillas Mechanical Mechanical Turk de Amazon.

[Página del proyecto] [Documentación] [? Arxiv] [? Conjuntos de datos] [? ️ Imagenmuseum] [⚔️ Genai-arena]

? Noticias

2024 10 de junio: el papel de Genai-Arena está fuera. Aparece en los documentos diarios de Huggingface.
2024 07 de junio: Imagenhub finalmente está en Pypi! Verifique: https://pypi.org/project/imagen-hub/
2024 Abr 07: Lanzamos las calificaciones de evaluación humana de acuerdo con nuestro último artículo de ARXIV.
2024 14 de febrero: pago ⚔️ Genai-arena ⚔️: ¡Benchmarking Visual Generation Models en la naturaleza!
2024 15 de enero: ¡Documento aceptado para ICLR 2024! ¡Nos vemos en Viena!
2024 7 de enero: ¡Actualizamos la guía de evaluación humana, Imagenmuseum Presentación! Ahora damos la bienvenida a los investigadores para que presenten su método en Imagenmuseum con un esfuerzo mínimo.
2023 23 de octubre: Versión 0.1.0 lanzado! ¡La documentación de ImagenHub ahora disponible!
2023 19 de octubre: Código publicado. Docios en construcción.
2023 13 de octubre: ¡Lanzamos Imagen Museum, una página de visualización para todos los modelos de ImagenHub!
2023 4 de octubre: ¡Nuestro papel aparece en los documentos diarios de Huggingface!
2023 2 de octubre: Documento disponible en ARXIV. ¡Código próximamente!

? Tabla de contenido

Instalación
? ‍? Empezar
Documentación
? Filosofía
? Que contribuye
Citación
? Reconocimiento
? Licencia

Instalación?

Instalar desde PYPI:

 pip install imagen-hub

O construir desde la fuente:

 git clone https : // github . com / TIGER - AI - Lab / ImagenHub . git
cd ImagenHub
conda env create - f env_cfg / imagen_environment . yml
conda activate imagen
pip install - e .

Para modelos como Dall-E, Dreamedit y Blipdiffusion, consulte la configuración adicional

Para algunos modelos (difusión estable, SDXL, COSXL, etc.), debe iniciar sesión a través de huggingface-cli .

huggingface-cli login

? ‍? Empiece?

Margen de evaluación

Para reproducir nuestro experimento reportado en el documento:

Ejemplo para la generación de imágenes guiadas por texto:

python3 benchmarking.py -cfg benchmark_cfg/ih_t2i.yml

Tenga en cuenta que la estructura de salida esperada sería:

result_root_folder
└── experiment_basename_folder
    ├── input (If applicable)
    │   └── image_1.jpg ...
    ├── model1
    │   └── image_1.jpg ...
    ├── model2
    │   └── image_1.jpg ...
    ├── ...

Luego, después de ejecutar el experimento, puedes ejecutar

python3 visualize.py --cfg benchmark_cfg/ih_t2i.yml

Para producir un archivo index.html para la visualización.

El archivo se vería como esto. Organizamos los resultados de nuestros experimentos en Imagen Museum.

Inferiendo un modelo

 import imagen_hub

model = imagen_hub . load ( "SDXL" )
image = model . infer_one_image ( prompt = "people reading pictures in a museum, watercolor" , seed = 1 )
image

Correr métricas

 from imagen_hub . metrics import MetricLPIPS
from imagen_hub . utils import load_image , save_pil_image , get_concat_pil_images

def evaluate_one ( model , real_image , generated_image ):
  score = model . evaluate ( real_image , generated_image )
  print ( "====> Score : " , score )

image_I = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/input/sample_102724_1.jpg" )
image_O = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/DiffEdit/sample_102724_1.jpg" )
show_image = get_concat_pil_images ([ image_I , image_O ], 'h' )

model = MetricLPIPS ()
evaluate_one ( model , image_I , image_O ) # ====> Score :  0.11225218325853348

show_image

Documentación?

Los tutoriales y la documentación de la API están alojados en imagenhub.readthedocs.io.

? Filosofía ?

Al racionalizar la investigación y la colaboración, ImageHub juega un papel fundamental en la propuesta del campo de la generación y edición de imágenes.

Pureza de la evaluación: aseguramos una evaluación justa y consistente para todos los modelos, eliminando los sesgos.
Hoja de ruta de investigación: al definir tareas y curar conjuntos de datos, proporcionamos una dirección clara para los investigadores.
Colaboración abierta: nuestra plataforma fomenta el intercambio y la cooperación de tecnologías relacionadas, reuniendo mentes e innovaciones.

Modelos implementados

Incluimos más de 30 modelos en síntesis de imágenes. Vea la lista completa aquí:

Modelos compatibles: #1
Métricas compatibles: #6

Método	Evento	Tipo
Difusión estable	-	Generación de texto a imagen
Difusión estable XL	arxiv'23	Generación de texto a imagen
Deepfloyd-if	-	Generación de texto a imagen
INPERSILLO	-	Generación de texto a imagen
Dall-E	-	Generación de texto a imagen
Kandinsky	-	Generación de texto a imagen
Mágico	arxiv'23	Edición de imágenes guiadas por texto
Instructpix2pix	CVPR'23	Edición de imágenes guiadas por texto
Difusión	ICLR'23	Edición de imágenes guiadas por texto
Imaginario	CVPR'23	Edición de imágenes guiadas por texto
Cicledifusión	ICCV'23	Edición de imágenes guiadas por texto
Sdedit	ICLR'22	Edición de imágenes guiadas por texto
Rápido	ICLR'23	Edición de imágenes guiadas por texto
Text2live	Eccv'22	Edición de imágenes guiadas por texto
Pix2pixzero	Siggraph'23	Edición de imágenes guiadas por texto
PLANEO	ICML'22	Edición de imágenes guiadas por máscaras
Difusión mezclada	CVPR'22	Edición de imágenes guiadas por máscaras
Inpenación de difusión estable	-	Edición de imágenes guiadas por máscaras
Difusión estable XL Inpenación	-	Edición de imágenes guiadas por máscaras
Inversión textual	ICLR'23	Generación de imágenes impulsada por sujetos
Difusión	arxiv'23	Generación de imágenes impulsada por sujetos
Dreambooth (+ lora)	CVPR'23	Generación de imágenes impulsada por sujetos
Photoswap	arxiv'23	Edición de imágenes impulsada por sujetos
Dreamedit	arxiv'23	Edición de imágenes impulsada por sujetos
Difusión personalizada	CVPR'23	Generación múltiple
Control de control	arxiv'23	Generación de imágenes guiada por control
Unicontrol	arxiv'23	Generación de imágenes guiada por control

Funcionalidad integral

Métricas comunes para Genai
Herramienta de visualización
Plantillas de Amazon Mechanical Turk (próximamente)

Estándar de ingeniería de software de alta calidad.

Documentación
Tipo de sugerencias
Cobertura de código (próximamente)

? Contribuyendo?

Para la comunidad

¡Se alientan las contribuciones de la comunidad!

ImagenHub todavía está en desarrollo. Se agregarán más modelos y características y siempre damos la bienvenida a las contribuciones para ayudar a mejorar ImagenHub. Si desea contribuir, consulte Contributing.md.

Creemos que todos pueden contribuir y marcar la diferencia. ¿Ya se trata de escribir código, arreglando errores? O simplemente compartiendo comentarios, ¿sus contribuciones son definitivamente bienvenidas y apreciadas?

Y si te gusta el proyecto, pero simplemente no tienes tiempo para contribuir, está bien. Hay otras formas fáciles de apoyar el proyecto y mostrar su agradecimiento, de lo que también estaríamos muy contentos:
Estrella el proyecto
Tweet al respecto
Consulte este proyecto en el ReadMe de su proyecto
Mencione el proyecto en las reuniones locales y cuénteles a sus amigos/colegas

Para los investigadores:

P: ¿Cómo puedo usar su método de evaluación para mi método?
R: Consulte https://imagenhub.readthedocs.io/en/latest/guidelines/humaneval.html
P: ¿Cómo puedo agregar mi método a la base de código ImageNhub?
R: Consulte https://imagenhub.readthedocs.io/en/latest/guidelines/custommodel.html
P: ¡Quiero presentar mi método en ImagenMuseum!
R: Consulte https://imagenhub.readthedocs.io/en/latest/guidelines/imagenmuseum.html

Cita?

Por favor, cita nuestro documento si usa nuestro código, datos, modelos o resultados:

 @inproceedings {
ku2024imagenhub,
title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
booktitle = { The Twelfth International Conference on Learning Representations } ,
year = { 2024 } ,
url = { https://openreview.net/forum?id=OuV9ZrkQlc }
}

 @article { ku2023imagenhub ,
  title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
  author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
  journal = { arXiv preprint arXiv:2310.01596 } ,
  year = { 2023 }
}