Téléchargement ImagenHub - Téléchargement du code source ImagenHub

ImagenHub

Autre code source

v0.3.0

Télécharger

? ️ Imagenhub

ImageNhub: standardizon l'évaluation des modèles de génération d'images conditionnels
ICLR 2024

ImageNhub est une bibliothèque à guichet unique pour normaliser l'inférence et l'évaluation de tous les modèles de génération d'images conditionnels.

Nous définissons 7 tâches importantes et organisons 7 ensembles de données d'évaluation de haute qualité pour chaque tâche.
Nous avons construit un pipeline d'inférence unifié pour assurer une comparaison équitable. Nous prenons actuellement en charge environ 30 modèles.
Nous avons conçu deux scores d'évaluation humaine, c'est-à-dire la cohérence sémantique et la qualité perceptuelle, ainsi que des directives complètes pour évaluer les images générées.
Nous fournissons du code pour la visualisation, l'autométrique et les modèles d'Amazon Mechanical Turk.

[Page du projet] [Documentation] [? ArXiv] [? Ensembles de données] [? ️ Imagenmuseum] [⚔️ Genai-arena]

? Nouvelles

2024 10 juin: le papier Genai-Arena est sorti. Il est présenté sur HuggingFace Daily Papers.
2024 juin 07: ImageNhub est enfin sur PYPI! Vérifier: https://pypi.org/project/imagen-hub/
2024 APR 07: Nous avons publié des notes d'évaluation humaine selon notre dernier article ArXIV.
2024 14 février: Checkout ⚔️ Genai-Arena ⚔️: Benchmarking Visual Generative Models in the Wild!
2024 15 janvier: document accepté à ICLR 2024! Rendez-vous à Vienne!
2024 7 janvier: Nous avons mis à jour les directives d'évaluation humaine, Imagenmuseum Soumission! Nous accueillons maintenant les chercheurs à soumettre leur méthode sur Imagenmuseum avec un minimum d'effort.
2023 23 octobre: Version 0.1.0 Sortie! La documentation d'imagenhub est maintenant disponible!
2023 19 octobre: code publié. Docs en construction.
2023 13 octobre: Nous avons publié Imagen Museum, une page de visualisation pour tous les modèles d'imagenhub!
2023 4 octobre: Notre article est présenté sur HuggingFace Daily Papers!
2023 2 octobre: Document disponible sur Arxiv. Code à venir bientôt!

? Table des matières

Installation
? ‍? Commencer
Documentation
? Philosophie
? Contributif
Citation
? Reconnaissance
? Licence

Installation?

Installer à partir de PYPI:

 pip install imagen-hub

Ou construire à partir de la source:

 git clone https : // github . com / TIGER - AI - Lab / ImagenHub . git
cd ImagenHub
conda env create - f env_cfg / imagen_environment . yml
conda activate imagen
pip install - e .

Pour des modèles comme Dall-E, DreameDit et Blipdiffusion, veuillez consulter une configuration supplémentaire

Pour certains modèles (diffusion stable, SDXL, COSXL, etc.), vous devez vous connecter à huggingface-cli .

huggingface-cli login

? ‍? Commencer?

Référence

Pour reproduire notre expérience rapportée dans le document:

Exemple de génération d'images guidé par le texte:

python3 benchmarking.py -cfg benchmark_cfg/ih_t2i.yml

Notez que la structure de sortie attendue serait:

result_root_folder
└── experiment_basename_folder
    ├── input (If applicable)
    │   └── image_1.jpg ...
    ├── model1
    │   └── image_1.jpg ...
    ├── model2
    │   └── image_1.jpg ...
    ├── ...

Puis après avoir exécuté l'expérience, vous pouvez courir

python3 visualize.py --cfg benchmark_cfg/ih_t2i.yml

Pour produire un fichier index.html pour la visualisation.

Le fichier ressemblerait à quelque chose comme ça. Nous avons hébergé nos résultats d'expérience sur Imagen Museum.

Déduire un modèle

 import imagen_hub

model = imagen_hub . load ( "SDXL" )
image = model . infer_one_image ( prompt = "people reading pictures in a museum, watercolor" , seed = 1 )
image

Exécuter des mesures

 from imagen_hub . metrics import MetricLPIPS
from imagen_hub . utils import load_image , save_pil_image , get_concat_pil_images

def evaluate_one ( model , real_image , generated_image ):
  score = model . evaluate ( real_image , generated_image )
  print ( "====> Score : " , score )

image_I = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/input/sample_102724_1.jpg" )
image_O = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/DiffEdit/sample_102724_1.jpg" )
show_image = get_concat_pil_images ([ image_I , image_O ], 'h' )

model = MetricLPIPS ()
evaluate_one ( model , image_I , image_O ) # ====> Score :  0.11225218325853348

show_image

Documentation?

Les tutoriels et la documentation de l'API sont hébergés sur ImageNhub.readthedocs.io.

? Philosophie ?

En rationalisant la recherche et la collaboration, ImageHub joue un rôle central dans la propulsion du domaine de la génération d'images et de l'édition.

Pureté de l'évaluation: Nous assurons une évaluation équitable et cohérente pour tous les modèles, éliminant les biais.
Feuille de route de recherche: En définissant les tâches et en organisant des ensembles de données, nous fournissons une orientation claire aux chercheurs.
Collaboration ouverte: notre plate-forme favorise l'échange et la coopération des technologies connexes, la réception des esprits et des innovations.

Modèles implémentés

Nous avons inclus plus de 30 modèles dans la synthèse d'image. Voir la liste complète ici:

Modèles pris en charge: # 1
Métriques prises en charge: # 6

Méthode	Lieu	Taper
Diffusion stable	-	Génération de texte à l'image
Diffusion stable xl	arXiv'23	Génération de texte à l'image
Deepfloyd-if	-	Génération de texte à l'image
Openjourney	-	Génération de texte à l'image
Dall-E	-	Génération de texte à l'image
Kandinsky	-	Génération de texte à l'image
Brush magique	arXiv'23	Édition d'image guidée par texte
Instructpix2pix	Cvpr'23	Édition d'image guidée par texte
Diffedit	Iclr'23	Édition d'image guidée par texte
Imaginaire	Cvpr'23	Édition d'image guidée par texte
Cyclédiffusion	ICCV'23	Édition d'image guidée par texte
Sdedit	Iclr'22	Édition d'image guidée par texte
Rapide	Iclr'23	Édition d'image guidée par texte
Text2Live	ECCV'22	Édition d'image guidée par texte
Pix2pixzero	Siggraph'23	Édition d'image guidée par texte
Glisser	Icml'22	Édition d'image guidée par masque
Diffusion mixte	Cvpr'22	Édition d'image guidée par masque
Diffusion stable entre la déintre	-	Édition d'image guidée par masque
Diffusion stable	-	Édition d'image guidée par masque
TextualInversion	Iclr'23	Génération d'images axée sur le sujet
Diffusion blip	arXiv'23	Génération d'images axée sur le sujet
Dreambooth (+ Lora)	Cvpr'23	Génération d'images axée sur le sujet
Saut de photos	arXiv'23	Édition d'image axée sur le sujet
Rêver	arXiv'23	Édition d'image axée sur le sujet
Diffusion personnalisée	Cvpr'23	Génération multi-sujets
Contrôle	arXiv'23	Génération d'images guidés par le contrôle
Unicontrol	arXiv'23	Génération d'images guidés par le contrôle

Fonctionnalité complète

Mesures communes pour Genai
Outil de visualisation
Modèles d'Amazon Mechanical Turk (à venir bientôt)

Norme d'ingénierie logicielle de haute qualité.

Documentation
Type Indices
Couverture du code (à venir bientôt)

? Contribuant?

Pour la communauté

Les contributions communautaires sont encouragées!

ImageNhub est toujours en cours de développement. Plus de modèles et de fonctionnalités vont être ajoutés et nous accueillons toujours les contributions pour aider à améliorer ImagenHub. Si vous souhaitez contribuer, veuillez consulter contribution.md.

Nous pensons que tout le monde peut contribuer et faire une différence. Qu'il s'agisse d'écrire du code, de corriger les bugs?

Et si vous aimez le projet, mais que vous n'avez tout simplement pas le temps de contribuer, c'est bien. Il existe d'autres moyens faciles de soutenir le projet et de montrer votre appréciation, ce dont nous serions également très heureux:
Strer le projet
Tweeter à ce sujet
Reportez-vous à ce projet dans Readme de votre projet
Mentionnez le projet lors des rencontres locales et dites à vos amis / collègues

Pour les chercheurs:

Q: Comment puis-je utiliser votre méthode d'évaluation pour ma méthode?
R: Veuillez vous référer à https://imagenhub.readthedocs.io/en/latest/guidelines/humaneval.html
Q: Comment puis-je ajouter ma méthode à ImageNhub Code Base?
R: Veuillez vous référer à https://imagenhub.readthedocs.io/en/latest/Guidelines/CustomoDel.html
Q: Je veux présenter ma méthode sur ImageNmuseum!
R: Veuillez vous référer à https://imagenhub.readthedocs.io/en/latest/guidelines/imagenmuseum.html

Citation?

Veuillez citer notre article si vous utilisez notre code, nos données, nos modèles ou nos résultats:

 @inproceedings {
ku2024imagenhub,
title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
booktitle = { The Twelfth International Conference on Learning Representations } ,
year = { 2024 } ,
url = { https://openreview.net/forum?id=OuV9ZrkQlc }
}

 @article { ku2023imagenhub ,
  title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
  author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
  journal = { arXiv preprint arXiv:2310.01596 } ,
  year = { 2023 }
}