min dalle загрузки - min dalle исходного кода скачать

min dalle

Питон

v0.4

Скачать

мин (далл · е)

YouTube проходит прозрение AI

Это быстрый минимальный порт Boris Dayma's Dall · E Mini (с мегапольными весами). Он был урезан для вывода и преобразован в Pytorch. Единственными сторонними зависимостями являются Numpy, запросы, подушка и факел.

Чтобы сгенерировать сетку 3x3 Dall · Ee Mega Images, которые требуются:

55 сек с T4 в Колаба
33 сек с P100 в Колаба
15 сек с A10G на обнимающемся лице

Вот более подробный разбивка производительности на A100. Кредит @Technobird22 и его Nevogen Discord Bot для графика.
мин-далле

Модель льна и код для преобразования в факел можно найти здесь.

Установить

$ pip install min-dalle

Использование

Загрузите параметры модели один раз и повторно используйте модель для генерации нескольких изображений.

 from min_dalle import MinDalle

model = MinDalle (
    models_root = './pretrained' ,
    dtype = torch . float32 ,
    device = 'cuda' ,
    is_mega = True , 
    is_reusable = True
)

Требуемые модели будут загружены на models_root , если их еще нет. Установите dtype на torch.float16 , чтобы сохранить память графического процессора. Если у вас есть графический процессор Ampere Architecture, вы можете использовать torch.bfloat16 . Установите device на «Cuda» или «CPU». Как только все завершит инициализацию, вызовите generate_image с некоторым текстом столько раз, сколько захотите. Используйте положительное seed для воспроизводимых результатов. Более высокие значения для supercondition_factor приводят к лучшему согласию с текстом, но более узкое разнообразие сгенерированных изображений. Каждый токен изображения отображается из наиболее вероятных токенов top_k . Самый большой логит вычитается из логитов, чтобы избежать инф. Затем логиты делятся на temperature . Если is_seamless это правда, сетка изображения будет покрыта плит в пространстве токена, а не в пиксельном пространстве.

 image = model . generate_image (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 4 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 32 ,
    is_verbose = False
)

display ( image )

мин-далле

Заслужить @hardmaru для примера

Сохранение отдельных изображений

Изображения также могут быть сгенерированы как FloatTensor , если вы хотите обработать их вручную.

 images = model . generate_images (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 3 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

Чтобы получить изображение в формат PIL, вам придется сначала переместить изображения в процессор и преобразовать тензор в массив Numpy.

 images = images . to ( 'cpu' ). numpy ()

Затем изображение $ i $ может быть покрыт Pil.Image и спасен

 image = Image . fromarray ( images [ i ])
image . save ( 'image_{}.png' . format ( i ))

Прогрессивные выходы

Если модель используется интерактивно (например, в ноутбуке) generate_image_stream может использоваться для генерации потока изображений, когда модель декодирует. Детоцессор добавляет небольшую задержку для каждого изображения. Установите progressive_outputs в True чтобы включить это. Пример реализован в Colab.

 image_stream = model . generate_image_stream (
    text = 'Dali painting of WALL·E' ,
    seed = - 1 ,
    grid_size = 3 ,
    progressive_outputs = True ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

for image in image_stream :
    display ( image )

мин-далле

Командная строка

Используйте image_from_text.py , чтобы генерировать изображения из командной строки.

$ python image_from_text.py --text= ' artificial intelligence ' --no-mega

мин-далле

Расширять

Дополнительная информация

Версия v0.4
Тип Питон
Время обновления 2025-07-14
размер 3.94MB
От Github

Связанные приложения

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
CRMEB Min с открытым исходным кодом Mall v4.3.2

2022-06-19

min dalle

мин (далл · е)

Установить

Использование

Сохранение отдельных изображений

Прогрессивные выходы

Командная строка

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

CRMEB Min с открытым исходным кодом Mall v4.3.2

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express