min dalle การดาวน์โหลด - min dalle ซอร์สโค้ดดาวน์โหลด

min dalle

หลาม

v0.4

ดาวน์โหลด

ขั้นต่ำ (Dall · E)

YouTube Walk-through โดย AI Epiphany

นี่คือพอร์ตที่รวดเร็วและน้อยที่สุดของ Dall · E Mini ของ Boris Dayma (พร้อมน้ำหนักขนาดใหญ่) มันถูกถอดออกสำหรับการอนุมานและแปลงเป็น pytorch การพึ่งพาของบุคคลที่สามเพียงอย่างเดียวคือ numpy คำขอหมอนและคบเพลิง

เพื่อสร้างภาพ 3x3 ของ Dall · E Mega Images:

55 วินาทีกับ T4 ใน colab
33 วินาทีพร้อม P100 ใน colab
15 วินาทีพร้อม A10G บนใบหน้ากอด

นี่คือรายละเอียดเพิ่มเติมของการแสดงบน A100 เครดิตถึง @Technobird22 และบอท Neogen Discord ของเขาสำหรับกราฟ
มินดีล

รูปแบบผ้าลินินและรหัสสำหรับการแปลงเป็นไฟฉายสามารถพบได้ที่นี่

ติดตั้ง

$ pip install min-dalle

การใช้งาน

โหลดพารามิเตอร์โมเดลหนึ่งครั้งและนำโมเดลกลับมาใช้ใหม่เพื่อสร้างหลายภาพ

 from min_dalle import MinDalle

model = MinDalle (
    models_root = './pretrained' ,
    dtype = torch . float32 ,
    device = 'cuda' ,
    is_mega = True , 
    is_reusable = True
)

รุ่นที่ต้องการจะถูกดาวน์โหลดไปยัง models_root หากยังไม่มีอยู่ที่นั่น ตั้งค่า dtype เป็น torch.float16 เพื่อบันทึกหน่วยความจำ GPU หากคุณมีสถาปัตยกรรม Ampere GPU คุณสามารถใช้ torch.bfloat16 ตั้งค่า device เป็น "cuda" หรือ "CPU" เมื่อทุกอย่างเริ่มต้นเสร็จแล้วให้โทรหา generate_image พร้อมข้อความบางส่วนตามที่คุณต้องการ ใช้ seed ที่เป็นบวกสำหรับผลลัพธ์ที่ทำซ้ำได้ ค่าที่สูงขึ้นสำหรับ supercondition_factor ส่งผลให้เกิดข้อตกลงที่ดีขึ้นกับข้อความ แต่มีภาพที่สร้างขึ้นที่หลากหลาย โทเค็นรูปภาพทุกรายการจะถูกสุ่มตัวอย่างจากโทเค็น top_k เป็นไปได้มากที่สุด logit ที่ใหญ่ที่สุดจะถูกลบออกจาก logits เพื่อหลีกเลี่ยง infs logits จะถูกหารด้วย temperature หาก is_seamless เป็นจริงตารางรูปภาพจะถูกปูกระเบื้องในพื้นที่โทเค็นไม่ใช่พื้นที่พิกเซล

 image = model . generate_image (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 4 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 32 ,
    is_verbose = False
)

display ( image )

มินดีล

เครดิตไปที่ @hardmaru สำหรับตัวอย่าง

บันทึกภาพแต่ละภาพ

ภาพยังสามารถสร้างเป็น FloatTensor ในกรณีที่คุณต้องการประมวลผลด้วยตนเอง

 images = model . generate_images (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 3 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

ในการรับภาพในรูปแบบ PIL คุณจะต้องย้ายรูปภาพไปยัง CPU ก่อนและแปลงเทนเซอร์เป็นอาร์เรย์ Numpy

 images = images . to ( 'cpu' ). numpy ()

จากนั้นภาพ $ i $ สามารถครอบคลุมไปยัง pil.image และบันทึก

 image = Image . fromarray ( images [ i ])
image . save ( 'image_{}.png' . format ( i ))

เอาต์พุตแบบก้าวหน้า

หากโมเดลถูกใช้งานแบบโต้ตอบ (เช่นในโน้ตบุ๊ก) generate_image_stream สามารถใช้ในการสร้างกระแสของภาพในขณะที่โมเดลกำลังถอดรหัส Detokenizer เพิ่มความล่าช้าเล็กน้อยสำหรับแต่ละภาพ ตั้งค่า progressive_outputs เป็น True เพื่อเปิดใช้งานสิ่งนี้ ตัวอย่างถูกนำไปใช้ใน colab

 image_stream = model . generate_image_stream (
    text = 'Dali painting of WALL·E' ,
    seed = - 1 ,
    grid_size = 3 ,
    progressive_outputs = True ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

for image in image_stream :
    display ( image )

มินดีล

บรรทัดคำสั่ง

ใช้ image_from_text.py เพื่อสร้างภาพจากบรรทัดคำสั่ง

$ python image_from_text.py --text= ' artificial intelligence ' --no-mega

มินดีล

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.4
ประเภท หลาม
เวลาอัปเดต 2025-07-14
ขนาด 3.94MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
CRMEB Min โอเพ่นซอร์สมอลล์ v4.3.2

2022-06-19

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
datamule python

หลาม
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด