ImagenHub Download - ดาวน์โหลดซอร์สโค้ด ImagenHub

ImagenHub

ซอร์สโค้ดอื่น ๆ

v0.3.0

ดาวน์โหลด

? imagenhub

ImagenHub: การประเมินมาตรฐานการประเมินแบบจำลองการสร้างภาพแบบมีเงื่อนไข
ICLR 2024

ImagenHub เป็นไลบรารีแบบครบวงจรเพื่อสร้างมาตรฐานการอนุมานและการประเมินผลของแบบจำลองการสร้างภาพแบบมีเงื่อนไขทั้งหมด

เรากำหนด 7 งานที่โดดเด่นและ Curate 7 ชุดข้อมูลการประเมินคุณภาพสูงสำหรับแต่ละงาน
เราสร้างท่ออนุมานแบบครบวงจรเพื่อให้แน่ใจว่ามีการเปรียบเทียบที่ยุติธรรม ขณะนี้เรารองรับรุ่นประมาณ 30 รุ่น
เราออกแบบคะแนนการประเมินของมนุษย์สองคะแนนคือความสอดคล้องทางความหมายและคุณภาพการรับรู้พร้อมกับแนวทางที่ครอบคลุมเพื่อประเมินภาพที่สร้างขึ้น
เราให้บริการรหัสสำหรับการสร้างภาพข้อมูลยานยนต์และเทมเพลตเติร์กเครื่องกลอเมซอน

[หน้าโครงการ] [เอกสาร] [? arxiv] [? ชุดข้อมูล] [? ime ImageNmuseum] [⚔ Genai-Arena]

- ข่าว

2024 มิ.ย. 10: กระดาษ Genai-Arena หมดแล้ว มันเป็นจุดเด่นในเอกสารประจำวันของ Huggingface
2024 มิ.ย. 07: ImagenHub ในที่สุดก็อยู่ใน PYPI! ตรวจสอบ: https://pypi.org/project/imagen-hub/
2024 เม.ย. 07: เราปล่อยคะแนนการประเมินผลของมนุษย์ตามกระดาษ Arxiv ล่าสุดของเรา
2024 14 ก.พ. : เช็คเอาต์⚔ Genai-Arena ⚔: การเปรียบเทียบแบบจำลองการกำเนิดภาพในป่า!
2024 ม.ค. 15: กระดาษยอมรับกับ ICLR 2024! เจอกันที่เวียนนา!
2024 ม.ค. 7: เราอัปเดตแนวทางการประเมินผลของมนุษย์, การส่ง ImagenMuseum! ตอนนี้เรายินดีต้อนรับนักวิจัยให้ส่งวิธีการเกี่ยวกับ Imagenmuseum ด้วยความพยายามน้อยที่สุด
2023 ต.ค. 23: รุ่น 0.1.0 เปิดตัว! เอกสารของ ImagenHub มีให้บริการแล้ว!
2023 ต.ค. 19: เผยแพร่รหัส เอกสารที่อยู่ระหว่างการก่อสร้าง
2023 ต.ค. 13: เราเปิดตัวพิพิธภัณฑ์ Imagen หน้าการสร้างภาพข้อมูลสำหรับทุกรุ่นจาก ImagenHub!
2023 ต.ค. 4: กระดาษของเราให้ความสำคัญกับ HuggingFace Daily Papers!
2023 ต.ค. 2: มีกระดาษบน Arxiv รหัสเร็ว ๆ นี้!

- สารบัญ

การติดตั้ง
?? เริ่มต้นใช้งาน
เอกสาร
- ปรัชญา
- การบริจาค
การอ้างอิง
- การรับทราบ
- ใบอนุญาต

การติดตั้ง?

ติดตั้งจาก PYPI:

 pip install imagen-hub

หรือสร้างจากแหล่งที่มา:

 git clone https : // github . com / TIGER - AI - Lab / ImagenHub . git
cd ImagenHub
conda env create - f env_cfg / imagen_environment . yml
conda activate imagen
pip install - e .

สำหรับนางแบบเช่น Dall-E, DreamEdit และ Blipdiffusion โปรดดูการตั้งค่าเพิ่มเติม

สำหรับบางรุ่น (การแพร่กระจายที่เสถียร, SDXL, COSXL ฯลฯ ) คุณต้องเข้าสู่ระบบผ่าน huggingface-cli

huggingface-cli login

?? เริ่มต้น?

การเปรียบเทียบ

เพื่อทำซ้ำการทดลองของเราที่รายงานในบทความ:

ตัวอย่างสำหรับการสร้างภาพที่นำด้วยข้อความ:

python3 benchmarking.py -cfg benchmark_cfg/ih_t2i.yml

โปรดทราบว่าโครงสร้างผลลัพธ์ที่คาดหวังจะเป็น:

result_root_folder
└── experiment_basename_folder
    ├── input (If applicable)
    │   └── image_1.jpg ...
    ├── model1
    │   └── image_1.jpg ...
    ├── model2
    │   └── image_1.jpg ...
    ├── ...

จากนั้นหลังจากเรียกใช้การทดสอบคุณสามารถเรียกใช้

python3 visualize.py --cfg benchmark_cfg/ih_t2i.yml

ในการสร้างไฟล์ index.html สำหรับการสร้างภาพข้อมูล

ไฟล์จะมีลักษณะเช่นนี้ เราเป็นเจ้าภาพผลการทดลองของเราในพิพิธภัณฑ์ Imagen

อนุมานหนึ่งรุ่น

 import imagen_hub

model = imagen_hub . load ( "SDXL" )
image = model . infer_one_image ( prompt = "people reading pictures in a museum, watercolor" , seed = 1 )
image

ตัวชี้วัดที่ใช้งาน

 from imagen_hub . metrics import MetricLPIPS
from imagen_hub . utils import load_image , save_pil_image , get_concat_pil_images

def evaluate_one ( model , real_image , generated_image ):
  score = model . evaluate ( real_image , generated_image )
  print ( "====> Score : " , score )

image_I = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/input/sample_102724_1.jpg" )
image_O = load_image ( "https://chromaica.github.io/Museum/ImagenHub_Text-Guided_IE/DiffEdit/sample_102724_1.jpg" )
show_image = get_concat_pil_images ([ image_I , image_O ], 'h' )

model = MetricLPIPS ()
evaluate_one ( model , image_I , image_O ) # ====> Score :  0.11225218325853348

show_image

เอกสาร?

เอกสารบทเรียนและ API นั้นโฮสต์บน imagenhub.readthedocs.io

- ปรัชญา ?

ด้วยการปรับปรุงการวิจัยและการทำงานร่วมกัน ImageHub มีบทบาทสำคัญในการขับเคลื่อนด้านการสร้างภาพและการแก้ไข

ความบริสุทธิ์ของการประเมินผล: เรามั่นใจว่าการประเมินที่ยุติธรรมและสม่ำเสมอสำหรับทุกรุ่นกำจัดอคติ
Research Roadmap: โดยการกำหนดงานและชุดข้อมูลการดูแลเราให้ทิศทางที่ชัดเจนสำหรับนักวิจัย
การทำงานร่วมกันแบบเปิด: แพลตฟอร์มของเราส่งเสริมการแลกเปลี่ยนและความร่วมมือของเทคโนโลยีที่เกี่ยวข้องนำความคิดและนวัตกรรมมารวมกัน

โมเดลที่ใช้งาน

เรารวมมากกว่า 30 รุ่นในการสังเคราะห์ภาพ ดูรายการทั้งหมดที่นี่:

รุ่นที่รองรับ: #1
ตัวชี้วัดที่รองรับ: #6

วิธี	สถานที่จัดงาน	พิมพ์
การแพร่กระจายที่มั่นคง	-	การสร้างข้อความเป็นภาพ
การแพร่กระจายที่เสถียร xl	arxiv'23	การสร้างข้อความเป็นภาพ
deepfloyd-if	-	การสร้างข้อความเป็นภาพ
โอเพ่น	-	การสร้างข้อความเป็นภาพ
Dall-e	-	การสร้างข้อความเป็นภาพ
Kandinsky	-	การสร้างข้อความเป็นภาพ
การพนัน	arxiv'23	การแก้ไขภาพที่นำด้วยข้อความ
cordspix2pix	cvpr'23	การแก้ไขภาพที่นำด้วยข้อความ
ความแตกต่าง	iclr'23	การแก้ไขภาพที่นำด้วยข้อความ
จินตนาการ	cvpr'23	การแก้ไขภาพที่นำด้วยข้อความ
การปั่นป่วน	iccv'23	การแก้ไขภาพที่นำด้วยข้อความ
sdedit	iclr'22	การแก้ไขภาพที่นำด้วยข้อความ
พรอมต์	iclr'23	การแก้ไขภาพที่นำด้วยข้อความ
text2live	eccv'22	การแก้ไขภาพที่นำด้วยข้อความ
pix2pixzero	siggraph'23	การแก้ไขภาพที่นำด้วยข้อความ
การร่อน	icml'22	การแก้ไขภาพหน้ากากนำทาง
การแพร่กระจายแบบผสมผสาน	cvpr'22	การแก้ไขภาพหน้ากากนำทาง
การแพร่กระจายที่เสถียรในการทาสี	-	การแก้ไขภาพหน้ากากนำทาง
การแพร่กระจายที่เสถียร xl inpainting	-	การแก้ไขภาพหน้ากากนำทาง
การส่งข้อความ	iclr'23	การสร้างภาพที่ขับเคลื่อนด้วยหัวเรื่อง
การพูดออกมา	arxiv'23	การสร้างภาพที่ขับเคลื่อนด้วยหัวเรื่อง
Dreambooth (+ Lora)	cvpr'23	การสร้างภาพที่ขับเคลื่อนด้วยหัวเรื่อง
รูปถ่าย	arxiv'23	การแก้ไขภาพที่ขับเคลื่อนด้วยหัวเรื่อง
DreamEdit	arxiv'23	การแก้ไขภาพที่ขับเคลื่อนด้วยหัวเรื่อง
การแพร่กระจายแบบกำหนดเอง	cvpr'23	รุ่นที่ขับเคลื่อน
การควบคุม	arxiv'23	การสร้างภาพที่นำด้วยการควบคุม
การควบคุม	arxiv'23	การสร้างภาพที่นำด้วยการควบคุม

ฟังก์ชั่นที่ครอบคลุม

ตัวชี้วัดทั่วไปสำหรับ Genai
เครื่องมือสร้างภาพ
เทมเพลต Turk Mechanical Mechanical (เร็ว ๆ นี้)

มาตรฐานวิศวกรรมซอฟต์แวร์คุณภาพสูง

เอกสาร
พิมพ์คำแนะนำ
การครอบคลุมรหัส (เร็ว ๆ นี้)

- บริจาค?

สำหรับชุมชน

สนับสนุนการมีส่วนร่วมของชุมชน!

ImagenHub ยังอยู่ระหว่างการพัฒนา มีการเพิ่มโมเดลและคุณสมบัติเพิ่มเติมและเรายินดีต้อนรับการมีส่วนร่วมเพื่อช่วยให้ ImagenHub ดีขึ้น หากคุณต้องการมีส่วนร่วมโปรดตรวจสอบการสนับสนุน

เราเชื่อว่าทุกคนสามารถมีส่วนร่วมและสร้างความแตกต่าง ไม่ว่าจะเป็นการเขียนโค้ดแก้ไขข้อบกพร่องหรือเพียงแค่แบ่งปันความคิดเห็นการมีส่วนร่วมของคุณยินดีต้อนรับและชื่นชมอย่างแน่นอน?

และถ้าคุณชอบโครงการ แต่ก็ไม่มีเวลามีส่วนร่วมนั่นก็ไม่เป็นไร มีวิธีง่าย ๆ อื่น ๆ ในการสนับสนุนโครงการและแสดงความขอบคุณซึ่งเราจะมีความสุขมากเกี่ยวกับ:
เป็นดาราโครงการ
ทวีตเกี่ยวกับเรื่องนี้
อ้างอิงโครงการนี้ใน readme ของโครงการของคุณ
พูดถึงโครงการที่ Meetups ท้องถิ่นและบอกเพื่อน/เพื่อนร่วมงานของคุณ

สำหรับนักวิจัย:

ถาม: ฉันจะใช้วิธีการประเมินผลของคุณสำหรับวิธีการของฉันได้อย่างไร?
ตอบ: โปรดดูที่ https://imagenhub.readthedocs.io/en/latest/guidelines/humaneval.html
ถาม: ฉันจะเพิ่มวิธีการของฉันใน ImagenHub Codebase ได้อย่างไร
ตอบ: โปรดดูที่ https://imagenhub.readthedocs.io/en/latest/guidelines/custondel.html
ถาม: ฉันต้องการนำเสนอวิธีการของฉันใน ImageNmuseum!
ตอบ: โปรดดูที่ https://imagenhub.readthedocs.io/en/latest/guidelines/imagenmuseum.html

การอ้างอิง?

โปรดกรุณาอ้างอิงบทความของเราหากคุณใช้รหัสข้อมูลรุ่นหรือผลลัพธ์:

 @inproceedings {
ku2024imagenhub,
title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
booktitle = { The Twelfth International Conference on Learning Representations } ,
year = { 2024 } ,
url = { https://openreview.net/forum?id=OuV9ZrkQlc }
}

 @article { ku2023imagenhub ,
  title = { ImagenHub: Standardizing the evaluation of conditional image generation models } ,
  author = { Max Ku and Tianle Li and Kai Zhang and Yujie Lu and Xingyu Fu and Wenwen Zhuang and Wenhu Chen } ,
  journal = { arXiv preprint arXiv:2310.01596 } ,
  year = { 2023 }
}