min dalle las descargas - min dalle la descarga del código fuente

min dalle

Pitón

v0.4

Descargar

min (dall · e)

Caminata por YouTube por la Epifanía AI

Este es un puerto rápido y mínimo de Dall · e mini de Boris Dayma (con mega pesos). Se ha despojado para inferencia y convertido a Pytorch. Las únicas dependencias de terceros son Numpy, solicitudes, almohada y antorcha.

Para generar una cuadrícula 3x3 de imágenes de Dall · E Mega Toma:

55 segundos con un T4 en Colab
33 segundos con un P100 en Colab
15 segundos con un A10G en la cara abrazada

Aquí hay un desglose más detallado del rendimiento en un A100. Crédito a @Technobird22 y su bot Neogen Discord Bot para el gráfico.
mínimo

El modelo de lino y el código para convertirlo en antorcha se pueden encontrar aquí.

Instalar

$ pip install min-dalle

Uso

Cargue los parámetros del modelo una vez y reutilice el modelo para generar múltiples imágenes.

 from min_dalle import MinDalle

model = MinDalle (
    models_root = './pretrained' ,
    dtype = torch . float32 ,
    device = 'cuda' ,
    is_mega = True , 
    is_reusable = True
)

Los modelos requeridos se descargarán a models_root si aún no están allí. Establezca el dtype en torch.float16 para guardar la memoria de GPU. Si tiene una GPU de arquitectura Ampere, puede usar torch.bfloat16 . Establezca el device en "CUDA" o "CPU". Una vez que todo haya terminado de inicializarse, llame generate_image con algún texto tantas veces como desee. Use una seed positiva para resultados reproducibles. Los valores más altos para supercondition_factor dan como resultado un mejor acuerdo con el texto, pero una variedad más estrecha de imágenes generadas. Cada token de imagen se muestrea desde los tokens más probables top_k . El logit más grande se resta de los logits para evitar INFS. Los logits se dividen por la temperature . Si is_seamless es verdadero, la cuadrícula de la imagen se balancea en el espacio de token, no en el espacio de píxeles.

 image = model . generate_image (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 4 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 32 ,
    is_verbose = False
)

display ( image )

mínimo

Crédito a @hardmaru por el ejemplo

Guardar imágenes individuales

Las imágenes también se pueden generar como un FloatTensor en caso de que desee procesarlas manualmente.

 images = model . generate_images (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 3 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

Para obtener una imagen en formato PIL, primero tendrá que mover las imágenes a la CPU y convertir el tensor en una matriz Numpy.

 images = images . to ( 'cpu' ). numpy ()

Luego imagen $ i $ se puede cubrir a un pil.image y guardado

 image = Image . fromarray ( images [ i ])
image . save ( 'image_{}.png' . format ( i ))

Salidas progresivas

Si el modelo se usa de manera interactiva (por ejemplo, en un cuaderno) generate_image_stream se puede usar para generar una secuencia de imágenes a medida que el modelo se decodifica. El Delokenizer agrega un ligero retraso para cada imagen. Establezca progressive_outputs en True para habilitar esto. Se implementa un ejemplo en el Colab.

 image_stream = model . generate_image_stream (
    text = 'Dali painting of WALL·E' ,
    seed = - 1 ,
    grid_size = 3 ,
    progressive_outputs = True ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

for image in image_stream :
    display ( image )

mínimo

Línea de comando

Use image_from_text.py para generar imágenes desde la línea de comando.

$ python image_from_text.py --text= ' artificial intelligence ' --no-mega

mínimo

Expandir

Información adicional

Versión v0.4
Tipo Pitón
Fecha de actualización 2025-07-14
tamaño 3.94MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
CRMEB Min centro comercial de código abierto v4.3.2

2022-06-19

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
datamule python

Pitón
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo