ImagenHubのダウンロードImagenHubソースコードのダウンロード

ImagenHub

その他のソースコード

v0.3.0

ダウンロード

？€imagenhub

ImagenHub：条件付き画像生成モデルの評価の標準化
ICLR 2024

ImagenHubは、すべての条件付き画像生成モデルの推論と評価を標準化するためのワンストップライブラリです。

7つの顕著なタスクを定義し、各タスクの7つの高品質の評価データセットをキュレートします。
公正な比較を確保するために、統一された推論パイプラインを構築しました。現在、約30のモデルをサポートしています。
生成された画像を評価するための包括的なガイドラインとともに、2つの人間の評価スコア、つまりセマンティックの一貫性と知覚品質を設計しました。
視覚化、Autometrics、Amazonの機械的なタークテンプレートのコードを提供します。

[プロジェクトページ] [ドキュメント] [？ arxiv] [？データセット] [？§imagenMuseum] [⚔️Genai-Arena]

？ニュース

2024年6月10日：genai-Arena Paperが出ています。 Huggingface Daily Papersで紹介されています。
2024年6月7日：ImagenHubがついにピピに登場しました！チェック：https：//pypi.org/project/imagen-hub/
2024年4月7日：最新のARXIV論文に従って、人間の評価評価をリリースしました。
2024年2月14日：チェックアウト⚔️genai-arena⚔️：野生の視覚生成モデルのベンチマーク！
2024年1月15日：ICLR 2024に紙が受け入れられました！ウィーンでお会いしましょう！
2024年1月7日：人間の評価ガイドライン、Imagenmuseumの提出を更新しました！今、私たちは研究者が最小限の努力でImagenMuseumに彼らの方法を提出することを歓迎します。
2023年10月23日：バージョン0.1.0がリリース！ ImagenHubのドキュメントが利用可能になりました！
2023年10月19日：コードがリリースされました。建設中のドキュメント。
2023年10月13日：ImagenHubのすべてのモデルの視覚化ページであるImagen Museumをリリースしました！
2023年10月4日：私たちの論文は、Huggingface Daily Papersで紹介されています！
2023年10月2日：arxivで入手可能な論文。コードがもうすぐです！

？目次

インストール
？‍？始めましょう
ドキュメント
？哲学
？貢献
引用
？了承
？ライセンス

インストール？

Pypiからのインストール：

 pip install imagen-hub

またはソースからビルド：

 git clone https : // github . com / TIGER - AI - Lab / ImagenHub . git
cd ImagenHub
conda env create - f env_cfg / imagen_environment . yml
conda activate imagen
pip install - e .

Dall-E、Dreamedit、BlipDiffusionなどのモデルについては、追加のセットアップをご覧ください

一部のモデル（安定した拡散、SDXL、COSXLなど）の場合、 huggingface-cliを介してログインする必要があります。

huggingface-cli login

？‍？始めますか？

ベンチマーク

論文で報告された実験を再現するために：

テキスト誘導画像生成の例：

python3 benchmarking.py -cfg benchmark_cfg/ih_t2i.yml

予想される出力構造は次のとおりです。

result_root_folder
└── experiment_basename_folder
    ├── input (If applicable)
    │   └── image_1.jpg ...
    ├── model1
    │   └── image_1.jpg ...
    ├── model2
    │   └── image_1.jpg ...
    ├── ...

その後、実験を実行した後、実行できます

python3 visualize.py --cfg benchmark_cfg/ih_t2i.yml

視覚化のためにindex.htmlファイルを生成します。

ファイルはこのようなものになります。 Imagen Museumで実験結果を開催しました。

1つのモデルを推測します

 import imagen_hub

model = imagen_hub . load ( "SDXL" )
image = model . infer_one_image ( prompt = "people reading pictures in a museum, watercolor" , seed = 1 )
image

ランニングメトリック

 from imagen_hub . metrics import MetricLPIPS
from imagen_hub . utils import load_image , save_pil_image , get_concat_pil_images

def evaluate_one ( model , real_image , generated_image ):
  score = model . evaluate ( real_image , generated_image )
  print ( "====> Score : " , score )

image_I = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/input/sample_102724_1.jpg" )
image_O = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/DiffEdit/sample_102724_1.jpg" )
show_image = get_concat_pil_images ([ image_I , image_O ], 'h' )

model = MetricLPIPS ()
evaluate_one ( model , image_I , image_O ) # ====> Score :  0.11225218325853348

show_image

ドキュメント？

チュートリアルとAPIドキュメントは、imagenhub.readthedocs.ioでホストされています。

？哲学？

研究とコラボレーションを合理化することにより、ImageHubは画像生成と編集の分野を推進する上で極めて重要な役割を果たします。

評価の純度：すべてのモデルの公正かつ一貫した評価を確保し、バイアスを排除します。
研究ロードマップ：タスクを定義し、データセットをキュレーションすることにより、研究者に明確な方向性を提供します。
オープンコラボレーション：当社のプラットフォームは、関連するテクノロジーの交換と協力を促進し、心と革新を結び付けます。

実装されたモデル

画像合成には30以上のモデルを含めました。ここで完全なリストを参照してください：

サポートされているモデル：＃1
サポートされているメトリック：＃6

方法	会場	タイプ
安定した拡散	-	テキストから画像への生成
安定した拡散XL	arxiv'23	テキストから画像への生成
deepfloyd-if	-	テキストから画像への生成
OpenJourney	-	テキストから画像への生成
Dall-E	-	テキストから画像への生成
カンディンスキー	-	テキストから画像への生成
マジックブラシ	arxiv'23	テキストガイド付き画像編集
instructpix2pix	CVPR'23	テキストガイド付き画像編集
diffedit	ICLR'23	テキストガイド付き画像編集
想像	CVPR'23	テキストガイド付き画像編集
cyclediffusion	ICCV'23	テキストガイド付き画像編集
sdedit	ICLR'22	テキストガイド付き画像編集
プロンプトから迅速	ICLR'23	テキストガイド付き画像編集
text2live	ECCV'22	テキストガイド付き画像編集
pix2pixzero	siggraph'23	テキストガイド付き画像編集
グライド	ICML'22	マスク誘導画像編集
混合拡散	CVPR'22	マスク誘導画像編集
安定した拡散インペインティング	-	マスク誘導画像編集
安定した拡散XLインペインティング	-	マスク誘導画像編集
TextualInversion	ICLR'23	サブジェクト駆動型の画像生成
ブリップ拡散	arxiv'23	サブジェクト駆動型の画像生成
dreambooth（+ lora）	CVPR'23	サブジェクト駆動型の画像生成
Photoswap	arxiv'23	サブジェクト駆動型の画像編集
Dreamedit	arxiv'23	サブジェクト駆動型の画像編集
カスタム拡散	CVPR'23	マルチサブジェクト駆動型の世代
ControlNet	arxiv'23	コントロールガイド画像生成
ユニコントロール	arxiv'23	コントロールガイド画像生成

包括的な機能

genaiの一般的な指標
視覚化ツール
Amazon Mechanical Turkテンプレート（近日公開）

高品質のソフトウェアエンジニアリング標準。

ドキュメント
タイプヒント
コードカバレッジ（近日公開）

？貢献？

コミュニティのために

コミュニティの貢献が奨励されています！

ImagenHubはまだ開発中です。より多くのモデルと機能が追加される予定であり、ImagenHubを改善するための貢献を常に歓迎します。貢献したい場合は、Convributing.mdをチェックしてください。

私たちは、誰もが貢献し、違いを生むことができると信じています。コードの作成、バグの修正、または単にフィードバックを共有するかどうかにかかわらず、貢献は間違いなく歓迎され、高く評価されていますか？

そして、あなたがプロジェクトが好きであるが、貢献する時間がないなら、それは大丈夫です。プロジェクトをサポートし、あなたの感謝を示す他の簡単な方法があります。
プロジェクトに出演します
それについてツイートします
このプロジェクトをプロジェクトのREADMEで参照してください
地元のミートアップでプロジェクトに言及し、友達/同僚に伝えてください

研究者のために：

Q：方法に評価方法を使用するにはどうすればよいですか？
A：https：//imagenhub.readthedocs.io/en/latest/guidelines/humaneval.htmlを参照してください
Q：ImagenHub CodeBaseにメソッドを追加するにはどうすればよいですか？
A：https：//imagenhub.readthedocs.io/en/latest/guidelines/custmodel.htmlを参照してください
Q：ImagenMuseumで自分の方法を紹介したい！
A：https：//imagenhub.readthedocs.io/en/latest/guidelines/imagenmuseum.htmlを参照してください

引用？

コード、データ、モデル、または結果を使用している場合は、私たちの論文を引用してください。

 @inproceedings {
ku2024imagenhub,
title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
booktitle = { The Twelfth International Conference on Learning Representations } ,
year = { 2024 } ,
url = { https://openreview.net/forum?id=OuV9ZrkQlc }
}

 @article { ku2023imagenhub ,
  title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
  author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
  journal = { arXiv preprint arXiv:2310.01596 } ,
  year = { 2023 }
}

？謝辞？

謝辞を参照してください

？ライセンス？

このプロジェクトはライセンスの下でリリースされます。

星の歴史？

拡大する

追加情報

バージョン v0.3.0
タイプその他のソースコード
更新時間 2025-03-07
サイズ 50.1MB
から Github

ImagenHub

？€imagenhub

？ニュース

？目次

インストール？

？‍？始めますか？

ベンチマーク

1つのモデルを推測します

ランニングメトリック

ドキュメント？

？哲学？

実装されたモデル

包括的な機能

高品質のソフトウェアエンジニアリング標準。

？貢献？

コミュニティのために

研究者のために：

引用？

？謝辞？

？ライセンス？

星の歴史？

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

ImagenHub

？€imagenhub

？ニュース

？目次

インストール？

？‍？始めますか？

ベンチマーク

1つのモデルを推測します

ランニングメトリック

ドキュメント？

？哲学 ？

実装されたモデル

包括的な機能

高品質のソフトウェアエンジニアリング標準。

？貢献？

コミュニティのために

研究者のために：

引用？

？謝辞？

？ライセンス？

星の歴史？

？哲学？