min dalle التنزيلات - min dalle تنزيل رمز المصدر

min dalle

بايثون

v0.4

تنزيل

مين (دال · هـ)

يوتيوب يسير من قبل عيد الغطاس من الذكاء الاصطناعي

هذا هو ميناء سريع ، الحد الأدنى من Dall · e mini (مع الأوزان الضخمة). تم تجريده من أجل الاستدلال وتحويله إلى Pytorch. تبعيات الطرف الثالث الوحيدة هي Numpy ، والطلبات ، والوسادة والشعلة.

لإنشاء شبكة 3 × 3 من الصور الضخمة التي تتطلبها:

55 ثانية مع T4 في كولاب
33 ثانية مع P100 في كولاب
15 ثانية مع A10G على وجه المعانقة

إليك تفصيلًا أكثر تفصيلاً للأداء على A100. الائتمان إلى @technobird22 و bot discord neogen الخاص به للرسم البياني.
مين دال

يمكن العثور على نموذج الكتان والرمز لتحويله إلى الشعلة هنا.

ثَبَّتَ

$ pip install min-dalle

الاستخدام

قم بتحميل معلمات النموذج مرة واحدة وإعادة استخدام النموذج لإنشاء صور متعددة.

 from min_dalle import MinDalle

model = MinDalle (
    models_root = './pretrained' ,
    dtype = torch . float32 ,
    device = 'cuda' ,
    is_mega = True , 
    is_reusable = True
)

سيتم تنزيل النماذج المطلوبة على models_root إذا لم تكن موجودة بالفعل. اضبط dtype على torch.float16 لحفظ ذاكرة GPU. إذا كان لديك GPU Ampere Architecture ، فيمكنك استخدام torch.bfloat16 . اضبط device على "CUDA" أو "وحدة المعالجة المركزية". بمجرد الانتهاء من التهيئة ، اتصل على generate_image مع بعض النصوص عدة مرات كما تريد. استخدم seed إيجابية للنتائج القابلة للتكرار. تؤدي القيم الأعلى لـ supercondition_factor إلى اتفاق أفضل مع النص ولكن مجموعة أضيق من الصور التي تم إنشاؤها. يتم أخذ عينات من كل رمز صورة من الرموز top_k احتمالا. يتم طرح أكبر لوجيت من السجلات لتجنب INFS. ثم يتم تقسيم السجلات على temperature . إذا كان is_seamless صحيحًا ، فستكون شبكة الصورة مبلطة بمساحة رمزية وليس مساحة بكسل.

 image = model . generate_image (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 4 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 32 ,
    is_verbose = False
)

display ( image )

مين دال

الائتمان إلى hardmaru على سبيل المثال

حفظ الصور الفردية

يمكن أيضًا إنشاء الصور باعتبارها FloatTensor في حال كنت ترغب في معالجتها يدويًا.

 images = model . generate_images (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 3 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

للحصول على صورة بتنسيق PIL ، سيتعين عليك أولاً نقل الصور إلى وحدة المعالجة المركزية وتحويل Tensor إلى صفيف numpy.

 images = images . to ( 'cpu' ). numpy ()

ثم الصورة $ i $ يمكن أن يتم تغطيتها إلى pil.mage وحفظها

 image = Image . fromarray ( images [ i ])
image . save ( 'image_{}.png' . format ( i ))

المخرجات التقدمية

إذا تم استخدام النموذج بشكل تفاعلي (على سبيل المثال في دفتر ملاحظات) ، يمكن استخدام generate_image_stream لإنشاء دفق من الصور لأن النموذج هو فك تشفير. يضيف Detokenizer تأخيرًا بسيطًا لكل صورة. set progressive_outputs إلى True لتمكين هذا. يتم تنفيذ مثال في كولاب.

 image_stream = model . generate_image_stream (
    text = 'Dali painting of WALL·E' ,
    seed = - 1 ,
    grid_size = 3 ,
    progressive_outputs = True ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

for image in image_stream :
    display ( image )

مين دال

سطر الأوامر

استخدم image_from_text.py لإنشاء الصور من سطر الأوامر.

$ python image_from_text.py --text= ' artificial intelligence ' --no-mega

مين دال

يوسع

معلومات إضافية

الإصدار v0.4
النوع بايثون
وقت التحديث 2025-07-14
الحجم 3.94MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
CRMEB Min مركز تسوق مفتوح المصدر v4.3.2

2022-06-19

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
datamule python

بايثون
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل