min dalle téléchargements - min dalle du code source téléchargement

min dalle

Python

v0.4

Télécharger

min (dall · e)

YouTube Walk-Through par l'épiphanie de l'IA

Il s'agit d'un port rapide et minimal de Boris Dayma's Dall · e Mini (avec des méga poids). Il a été dépouillé pour l'inférence et converti en pytorch. Les seules dépendances tierces sont Numpy, les demandes, l'oreiller et la torche.

Pour générer une grille 3x3 de Dall · E Mega Images cela prend:

55 sec avec un T4 à Colab
33 sec avec un P100 à Colab
15 sec avec un A10g sur le visage étreint

Voici une ventilation plus détaillée des performances sur un A100. Crédit à @ Technobird22 et son bot de Discord Neogen pour le graphique.
min-dalle

Le modèle de lin et le code pour la convertir en torche peuvent être trouvés ici.

Installer

$ pip install min-dalle

Usage

Chargez les paramètres du modèle une fois et réutilisez le modèle pour générer plusieurs images.

 from min_dalle import MinDalle

model = MinDalle (
    models_root = './pretrained' ,
    dtype = torch . float32 ,
    device = 'cuda' ,
    is_mega = True , 
    is_reusable = True
)

Les modèles requis seront téléchargés sur models_root s'ils ne sont pas déjà là. Définissez le dtype sur torch.float16 pour enregistrer la mémoire GPU. Si vous avez un GPU Architecture AMPERE, vous pouvez utiliser torch.bfloat16 . Définissez l' device sur "CUDA" ou "CPU". Une fois que tout a terminé son initialisation, appelez generate_image avec du texte autant de fois que vous le souhaitez. Utilisez une seed positive pour les résultats reproductibles. Des valeurs plus élevées pour supercondition_factor entraînent un meilleur accord avec le texte mais une variété plus étroite d'images générées. Chaque jeton d'image est échantillonné à partir des jetons les plus probables top_k . Le logit le plus important est soustrait des logits pour éviter les infs. Les logits sont ensuite divisés par la temperature . Si is_seamless est vrai, la grille d'image sera carrelée dans l'espace de jeton et non sur l'espace de pixel.

 image = model . generate_image (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 4 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 32 ,
    is_verbose = False
)

display ( image )

min-dalle

Crédit à @hardmaru pour l'exemple

Enregistrer des images individuelles

Les images peuvent également être générées en tant que FloatTensor au cas où vous voudriez les traiter manuellement.

 images = model . generate_images (
    text = 'Nuclear explosion broccoli' ,
    seed = - 1 ,
    grid_size = 3 ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

Pour obtenir une image au format PIL, vous devrez d'abord déplacer les images vers le CPU et convertir le tenseur en un tableau Numpy.

 images = images . to ( 'cpu' ). numpy ()

Puis image $ i $ peut être coupé à un pil.image et enregistré

 image = Image . fromarray ( images [ i ])
image . save ( 'image_{}.png' . format ( i ))

Sorties progressives

Si le modèle est utilisé de manière interactive (par exemple dans un ordinateur portable), generate_image_stream peut être utilisé pour générer un flux d'images lorsque le modèle est décodant. Le détokenzer ajoute un léger retard pour chaque image. Définissez progressive_outputs sur True pour activer cela. Un exemple est implémenté dans le colab.

 image_stream = model . generate_image_stream (
    text = 'Dali painting of WALL·E' ,
    seed = - 1 ,
    grid_size = 3 ,
    progressive_outputs = True ,
    is_seamless = False ,
    temperature = 1 ,
    top_k = 256 ,
    supercondition_factor = 16 ,
    is_verbose = False
)

for image in image_stream :
    display ( image )

min-dalle

Ligne de commande

Utilisez image_from_text.py pour générer des images à partir de la ligne de commande.

$ python image_from_text.py --text= ' artificial intelligence ' --no-mega

min-dalle

Développer

Informations supplémentaires

Version v0.4
Type Python
Date de mise à jour 2025-07-14
taille 3.94MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Centre commercial open source CRMEB Min v4.3.2

2022-06-19

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
datamule python

Python
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout