dalle flow Download - dalle flow Source Téléchargement

Dall · e Flow: un flux de travail humain dans la boucle pour créer des images HD à partir de texte
Un humain dans la boucle ^? flux de travail pour créer des images HD à partir de texte

Dall · e Flow est un flux de travail interactif pour générer des images à haute définition à partir de l'invite de texte. Tout d'abord, il exploite Dall · E-Mega, GLID-3 XL et diffusion stable pour générer des candidats d'image, puis appelle Clip-as-Service pour classer les candidats à l'invite. Le candidat préféré est alimenté à Glid-3 XL pour la diffusion, qui enrichit souvent la texture et le fond. Enfin, le candidat est augmenté à 1024x1024 via Swinir.

Le flux de Dall · e est construit avec Jina dans une architecture client-serveur, ce qui lui donne une grande évolutivité, un streaming non bloquant et une interface pythonique moderne. Le client peut interagir avec le serveur via GRPC / WebSocket / HTTP avec TLS.

Pourquoi humain dans la boucle? L'art génératif est un processus créatif. Alors que les avancées récentes de Dall · e se déchaînent la créativité des gens, un UX / UI-sorti-sortie unique verrouille l'imagination à une seule possibilité, ce qui est mauvais, peu importe à quel point ce résultat unique est bon. Le flux de Dall · e est une alternative à la ligne unique, en formalisant l'art génératif en tant que procédure itérative.

Usage

Le flux de Dall · e est dans l'architecture client-serveur.

Utilisation du client
Utilisation du serveur, c'est-à-dire déployer votre propre serveur

Mises à jour

? 2022/10/27 REASERGAN UPSCELERS a été ajouté.
️ 2022/10/26 Pour utiliser Clip-As-Service disponible sur grpcs://api.clip.jina.ai:2096 (nécessite jina >= v3.11.0 ), vous devez d'abord obtenir un jeton d'accès à partir d'ici. Voir Utiliser le clip-as-service pour plus de détails.
? 2022/9/25 La segmentation automatisée basée sur des clips à partir d'une invite a été ajoutée.
? 2022/8/17 Le texte à l'image pour une diffusion stable a été ajouté. Pour l'utiliser, vous devrez accepter leur TOS, télécharger les poids, puis activer l'indicateur dans docker ou flow_parser.py .
️ 2022/8/8 a commencé à utiliser Clip-As-Service comme exécuteur externe. Vous pouvez maintenant déployer facilement votre propre exécuteur de clip si vous le souhaitez. Il y a un petit changement de rupture à la suite de cette amélioration, veuillez donc rouvrir le cahier dans Google Colab.
️ 2022/7/6 Demo Server Migration vers AWS EKS Pour une meilleure disponibilité et une meilleure robustesse, l'URL du serveur change maintenant en grpcs://dalle-flow.dev.jina.ai . Toutes les connexions sont maintenant avec le cryptage TLS, veuillez rouvrir le cahier dans Google Colab.
️ 2022/6/25 temps d'arrêt inattendu entre le 6/25 0:00 - 12:00 CET en raison de quotas hors GPU. Le nouveau serveur dispose désormais de 2 GPU, Ajouter HealthCheck dans le carnet client.
2022/6/3 Réduisez le nombre par défaut d'images à 2 par voie, 4 pour la diffusion.
? 2022/6/21 Une image pré-construite est maintenant disponible sur Docker Hub! Cette image peut être exécutée hors de la boîte sur CUDA 11.6. Corrigez un bug en amont dans Clip-as-Service.
️ 2022/5/23 Corrigez un bug en amont en clip-as-service. Ce bug rend la 2ème étape de diffusion sans rapport avec les textes donnés. Le nouveau dockerfile s'est avéré reproductible sur une instance AWS EC2 p2.x8large .
2022 / 5/13B Retrait TLS comme CloudFlare donne un délai d'expiration des 100, en faisant un flux Dalle dans utilisable, veuillez rouvrir le cahier dans Google Colab!.
? 2022/5/13 NOUVEAU MEGA MEGA CHECKPOINT! Toutes les connexions sont maintenant avec TLS, veuillez rouvrir le cahier dans Google Colab!.
? 2022/5/10 Un dockerfile est ajouté! Vous pouvez désormais déployer votre propre flux de canal de gamme. Nouveau méga point de contrôle! Impreinte à mémoire de mémoire plus petite, l'ensemble du flux peut désormais s'adapter à un GPU avec une mémoire de 21 Go .
? 2022/5/7 Nouveau Mega Checkpoint et optimisation multiple sur GLID3: Moins de mémoire-fotprint, utilisez ViT-L/14@336px à partir de clip-as-service, steps 100->200 .
? 2022/5/6 DALL · E Flow vient de mettre à jour! Veuillez rouvrir le cahier dans Google Colab!
- Révisé la première étape: 16 candidats sont générés, 8 à partir de Dall · E Mega, 8 de GLID3-XL; puis classé par clip en tant que service.
- Amélioration de l'efficacité du débit: la vitesse globale, y compris la diffusion et la mise à l'échelle, sont beaucoup plus rapides maintenant!

Galerie

a realistic photo of a muddy dog A scientist comparing apples and oranges, by Norman Rockwell an oil painting portrait of the regal Burger King posing with a Whopper Eternal clock powered by a human cranium, artstation another planet amazing landscape The Decline and Fall of the Roman Empire board game kickstarter A raccoon astronaut with the cosmos reflecting on the glass of his helmet dreaming of the stars, digital art A photograph of an apple that is a disco ball, 85 mm lens, studio lighting a cubism painting Donald trump happy cyberpunk oil painting of a hamster drinking tea outside Colossus of Rhodes by Max Ernst landscape with great castle in middle of forest an medieval oil painting of Kanye west feels satisfied while playing chess in the style of Expressionism An oil pastel painting of an annoyed cat in a spaceship dinosaurs at the brink of a nuclear disaster fantasy landscape with medieval city GPU chip in the form of an avocado, digital art a giant rubber duck in the ocean Paddington bear as austrian emperor in antique black & white photography a rainy night with a superhero perched above a city, in the style of a comic book A synthwave style sunset above the reflecting water of the sea, digital art an oil painting of ocean beach front in the style of Titian an oil painting of Klingon general in the style of Rubens city, top view, cyberpunk, digital realistic art an oil painting of a medieval cyborg automaton made of magic parts and old steampunk mechanics a watercolour painting of a top view of a pirate ship sailing on the clouds a knight made of beautiful flowers and fruits by Rachel ruysch in the style of Syd brak a 3D render of a rainbow colored hot air balloon flying above a reflective lake a teddy bear on a skateboard in Times Square cozy bedroom at night an oil painting of monkey using computer the diagram of a search machine invented by Leonardo da Vinci A stained glass window of toucans in outer space a campfire in the woods at night with the milky-way galaxy in the sky Bionic killer robot made of AI scarab beetles The Hanging Gardens of Babylon in the middle of a city, in the style of Dalí painting oil of Izhevsk a hyper realistic photo of a marshmallow office chair fantasy landscape with city ocean beach front view in Van Gogh style An oil painting of a family reunited inside of an airport, digital art antique photo of a knight riding a T-Rex a top view of a pirate ship sailing on the clouds an oil painting of a humanoid robot playing chess in the style of Matisse a cubism painting of a cat dressed as French emperor Napoleon a husky dog wearing a hat with sunglasses A mystical castle appears between the clouds in the style of Vincent di Fate golden gucci airpods realistic photo

Client

L'utilisation du client est super facile. Les étapes suivantes sont mieux exécutées dans Jupyter Notebook ou Google Colab.

Vous devrez d'abord installer Docarray et Jina:

pip install " docarray[common]>=0.13.5 " jina

Nous avons fourni un serveur de démonstration à jouer:

️ En raison des demandes massives, notre serveur peut être un retard en réponse. Pourtant, nous sommes très confiants pour garder le temps de disponibilité élevé. Vous pouvez également déployer votre propre serveur en suivant les instructions ici.

 server_url = 'grpcs://dalle-flow.dev.jina.ai'

Étape 1: Générer via Dall · e Mega

Définissons maintenant l'invite:

 prompt = 'an oil painting of a humanoid robot playing chess in the style of Matisse'

Soudissons-le au serveur et visualisons les résultats:

 from docarray import Document

doc = Document ( text = prompt ). post ( server_url , parameters = { 'num_images' : 8 })
da = doc . matches

da . plot_image_sprites ( fig_size = ( 10 , 10 ), show_index = True )

Ici, nous générons 24 candidats, 8 à partir de dalle-méga, 8 à partir de GLID3 XL et 8 à partir de diffusion stable, ceci est tel que défini dans num_images , qui prend environ environ 2 minutes. Vous pouvez utiliser une valeur plus petite si elle est trop longue pour vous.

Étape 2: Sélectionnez et raffinement via GLID3 XL

Les 24 candidats sont triés par Clip-as-Service, avec Index- 0 comme le meilleur candidat jugé par Clip. Bien sûr, vous pouvez penser différemment. Remarquez le numéro dans le coin supérieur gauche? Sélectionnez celui que vous aimez le plus et obtenez une meilleure vue:

 fav_id = 3
fav = da [ fav_id ]
fav . embedding = doc . embedding
fav . display ()

Soumissionons maintenant les candidats sélectionnés au serveur pour diffusion.

 diffused = fav . post ( f' { server_url } ' , parameters = { 'skip_rate' : 0.5 , 'num_images' : 36 }, target_executor = 'diffusion' ). matches

diffused . plot_image_sprites ( fig_size = ( 10 , 10 ), show_index = True )

Cela donnera 36 images basées sur l'image sélectionnée. Vous pouvez permettre au modèle d'improviser davantage en donnant skip_rate une valeur proche de zéro, ou une valeur proche d'un pour forcer sa proximité avec l'image donnée. Toute la procédure dure environ 2 minutes.

Étape 3: Sélectionnez et haut de gamme via Swinir

Sélectionnez l'image que vous aimez le plus et donnez-lui de plus près:

 dfav_id = 34
fav = diffused [ dfav_id ]
fav . display ()

Enfin, soumettez-vous au serveur pour la dernière étape: augmente à 1024 x 1024px.

 fav = fav . post ( f' { server_url } /upscale' )
fav . display ()

C'est ça! C'est celui-là . Si ce n'est pas satisfait, veuillez répéter la procédure.

BTW, Docarray est une structure de données puissante et facile à utiliser pour les données non structurées. Il est super productif pour les scientifiques des données qui travaillent dans un domaine cross / multimodal. Pour en savoir plus sur Docarray, veuillez consulter les documents.

Serveur

Vous pouvez héberger votre propre serveur en suivant les instructions ci-dessous.

Exigences matérielles

Le flux de Dall · E nécessite un GPU avec 21 Go de VRAM à son apogée. Tous les services sont pressés dans ce GPU, cela comprend (à peu près)

Dalle ~ 9 Go
Diffusion adhérente ~ 6 Go
Diffusion stable ~ 8 Go (batch_size = 4 dans config.yml , 512x512)
Swinir ~ 3 Go
Clip Vit-L / 14-336PX ~ 3 Go

Les astuces raisonnables suivantes peuvent être utilisées pour réduire davantage VRAM:

Swinir peut être déplacé vers le processeur (-3 Go)
Le clip peut être délégué au serveur gratuit à clip-service (-3 Go)

Il nécessite au moins 50 Go d'espace gratuit sur le disque dur, principalement pour télécharger des modèles pré-entraînés.

Internet à grande vitesse est requis. Internet lent / instable peut lancer un délai de délai frustrant lors du téléchargement des modèles.

L'environnement uniquement du processeur n'est pas testé et ne fonctionnera probablement pas. Google Colab lance probablement OOM et ne fonctionnera donc pas non plus.

Architecture de serveur

Si vous avez installé Jina, l'organigramme ci-dessus peut être généré via:

 # pip install jina
jina export flowchart flow.yml flow.svg

Poids de diffusion stables

Si vous souhaitez utiliser une diffusion stable, vous devrez d'abord enregistrer un compte sur le site Web HuggingFace et accepter les termes et conditions du modèle. Après vous être connecté, vous pouvez trouver la version du modèle requise en allant ici:

Compvis / sd-v1-5-painting.ckpt

Dans la section Téléchargez les poids , cliquez sur le lien pour sd-v1-x.ckpt . Les derniers poids au moment de la rédaction sont sd-v1-5.ckpt .

Utilisateurs de Docker : placez ce fichier dans un dossier nommé ldm/stable-diffusion-v1 et renommez-le model.ckpt . Suivez soigneusement les instructions ci-dessous car SD n'est pas activé par défaut.

Utilisateurs natifs : placez ce fichier dans dalle/stable-diffusion/models/ldm/stable-diffusion-v1/model.ckpt après avoir terminé le reste des étapes sous "Run nativement". Suivez soigneusement les instructions ci-dessous car SD n'est pas activé par défaut.

Courir dans Docker

Image préconçue

Nous avons fourni une image docker prédéfinie qui peut être tirée directement.

docker pull jinaai/dalle-flow:latest

Construisez-le vous-même

Nous avons fourni un dockerfile qui vous permet d'exécuter un serveur hors de la boîte.

Notre dockerfile utilise CUDA 11.6 comme image de base, vous voudrez peut-être l'ajuster en fonction de votre système.

git clone https://github.com/jina-ai/dalle-flow.git
cd dalle-flow

docker build --build-arg GROUP_ID= $( id -g ${USER} ) --build-arg USER_ID= $( id -u ${USER} ) -t jinaai/dalle-flow .

Le bâtiment prendra 10 minutes avec une vitesse Internet moyenne, ce qui se traduit par une image Docker de 18 Go.

Récipient à parcourir

Pour l'exécuter, faites simplement:

docker run -p 51005:51005 
  -it 
  -v $HOME /.cache:/home/dalle/.cache 
  --gpus all 
  jinaai/dalle-flow

Alternativement, vous pouvez également exécuter avec certains workflows activés ou désactivés pour éviter les plantages hors mémoire. Pour ce faire, passer l'une de ces variables d'environnement:

 DISABLE_DALLE_MEGA
DISABLE_GLID3XL
DISABLE_SWINIR
ENABLE_STABLE_DIFFUSION
ENABLE_CLIPSEG
ENABLE_REALESRGAN

Par exemple, si vous souhaitez désactiver les workflows GLID3XL, exécutez:

docker run -e DISABLE_GLID3XL= ' 1 ' 
  -p 51005:51005 
  -it 
  -v $HOME /.cache:/home/dalle/.cache 
  --gpus all 
  jinaai/dalle-flow

La première course prendra environ 10 minutes avec une vitesse Internet moyenne.
-v $HOME/.cache:/root/.cache évite le téléchargement de modèle répété sur chaque exécution docker.
La première partie de -p 51005:51005 est votre port public hôte. Assurez-vous que les gens peuvent accéder à ce port si vous servez publiquement. Le deuxième parmi de celui-ci est le port défini dans Flow.yml.
Si vous souhaitez utiliser une diffusion stable, il doit être activé manuellement avec le ENABLE_STABLE_DIFFUSION .
Si vous souhaitez utiliser ClipSeg, il doit être activé manuellement avec le ENABLE_CLIPSEG .
Si vous souhaitez utiliser reresrgan, il doit être activé manuellement avec le ENABLE_REALESRGAN .

Instructions spéciales pour la diffusion stable et Docker

La diffusion stable ne peut être activée que si vous avez téléchargé les poids et les rendre disponibles en tant que volume virtuel tout en activant l'indicateur environnemental ( ENABLE_STABLE_DIFFUSION ) pour SD .

Vous auriez dû auparavant mettre les poids dans un dossier nommé ldm/stable-diffusion-v1 et les étiqueter model.ckpt . Remplacez YOUR_MODEL_PATH/ldm ci-dessous par le chemin de votre propre système pour tuer les poids dans l'image Docker.

docker run -e ENABLE_STABLE_DIFFUSION= " 1 " 
  -e DISABLE_DALLE_MEGA= " 1 " 
  -e DISABLE_GLID3XL= " 1 " 
  -p 51005:51005 
  -it 
  -v YOUR_MODEL_PATH/ldm:/dalle/stable-diffusion/models/ldm/ 
  -v $HOME /.cache:/home/dalle/.cache 
  --gpus all 
  jinaai/dalle-flow

Vous devriez voir l'écran comme suivant une fois en cours d'exécution:

Notez que contrairement à la course native, l'exécution à l'intérieur de Docker peut donner une barre de progrès, des journaux de couleur et des impressions moins vifs. Cela est dû aux limites du terminal dans un conteneur Docker. Cela n'affecte pas l'utilisation réelle.

Courir nativement

L'exécution native nécessite des étapes manuelles, mais il est souvent plus facile de déboguer.

Dépositions de clonage

mkdir dalle && cd dalle
git clone https://github.com/jina-ai/dalle-flow.git
git clone https://github.com/jina-ai/SwinIR.git
git clone --branch v0.0.15 https://github.com/AmericanPresidentJimmyCarter/stable-diffusion.git
git clone https://github.com/CompVis/latent-diffusion.git
git clone https://github.com/jina-ai/glid-3-xl.git
git clone https://github.com/timojl/clipseg.git

Vous devriez avoir la structure du dossier suivant:

 dalle/
 |
 |-- Real-ESRGAN/
 |-- SwinIR/
 |-- clipseg/
 |-- dalle-flow/
 |-- glid-3-xl/
 |-- latent-diffusion/
 |-- stable-diffusion/

Installer des reposs auxiliaires

 cd dalle-flow
python3 -m virtualenv env
source env/bin/activate && cd -
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
pip install numpy tqdm pytorch_lightning einops numpy omegaconf
pip install https://github.com/crowsonkb/k-diffusion/archive/master.zip
pip install git+https://github.com/AmericanPresidentJimmyCarter/[email protected]
pip install basicsr facexlib gfpgan
pip install realesrgan
pip install https://github.com/AmericanPresidentJimmyCarter/xformers-builds/raw/master/cu116/xformers-0.0.14.dev0-cp310-cp310-linux_x86_64.whl && 
cd latent-diffusion && pip install -e . && cd -
cd stable-diffusion && pip install -e . && cd -
cd SwinIR && pip install -e . && cd -
cd glid-3-xl && pip install -e . && cd -
cd clipseg && pip install -e . && cd -

Il y a des modèles de couple que nous devons télécharger pour GLID-3-XL si vous utilisez cela:

 cd glid-3-xl
wget https://dall-3.com/models/glid-3-xl/bert.pt
wget https://dall-3.com/models/glid-3-xl/kl-f8.pt
wget https://dall-3.com/models/glid-3-xl/finetune.pt
cd -

clipseg et RealESRGAN vous obligent à définir un chemin de dossier de cache correct, généralement quelque chose comme $ home /.

Installer le flux

 cd dalle-flow
pip install -r requirements.txt
pip install jax~=0.3.24

Démarrer le serveur

Vous êtes maintenant sous dalle-flow/ , exécutez la commande suivante:

 # Optionally disable some generative models with the following flags when
# using flow_parser.py:
# --disable-dalle-mega
# --disable-glid3xl
# --disable-swinir
# --enable-stable-diffusion
python flow_parser.py
jina flow --uses flow.tmp.yml

Vous devriez voir cet écran immédiatement:

Au premier départ, il faudra ~ 8 minutes pour télécharger le modèle MEGA DALL · E et d'autres modèles nécessaires. Les courses de procédure ne devraient prendre que environ 1 minute pour atteindre le message de réussite.

Quand tout sera prêt, vous verrez:

Bravo! Vous devriez maintenant pouvoir exécuter le client.

Vous pouvez modifier et étendre le flux de serveur comme vous le souhaitez, par exemple, modifier le modèle, ajoutant de la persistance ou même publication automatique à Instagram / Opensesea. Avec Jina et Docarray, vous pouvez facilement rendre le nuage de flux de Dall et prêt pour la production.

Utilisez le clip comme service

Pour réduire l'utilisation de VRAM, vous pouvez utiliser le CLIP-as-service comme exécuteur externe disponible gratuitement sur grpcs://api.clip.jina.ai:2096 .
Tout d'abord, assurez-vous d'avoir créé un jeton d'accès à partir du site Web de la console ou de la CLI comme suivant

jina auth token create < name of PAT > -e < expiration days >

Ensuite, vous devez modifier les configurations liées à l'exécuteur ( host , port , external , tls et grpc_metadata ) de flow.yml .

...
  - name : clip_encoder
    uses : jinahub+docker://CLIPTorchEncoder/latest-gpu
    host : ' api.clip.jina.ai '
    port : 2096
    tls : true
    external : true
    grpc_metadata :
      authorization : " <your access token> "
    needs : [gateway]
...
  - name : rerank
    uses : jinahub+docker://CLIPTorchEncoder/latest-gpu
    host : ' api.clip.jina.ai '
    port : 2096
    uses_requests :
      ' / ' : rank
    tls : true
    external : true
    grpc_metadata :
      authorization : " <your access token> "
    needs : [dalle, diffusion]

Vous pouvez également utiliser le flow_parser.py pour générer et exécuter automatiquement le flux avec en utilisant le CLIP-as-service comme exécuteur externe:

python flow_parser.py --cas-token " <your access token>'
jina flow --uses flow.tmp.yml

️ grpc_metadata n'est disponible qu'après Jina v3.11.0 . Si vous utilisez une version plus ancienne, veuillez passer à la dernière version.

Maintenant, vous pouvez utiliser le CLIP-as-service dans votre flux.

Soutien

Pour étendre le flux à Dall, vous devrez vous familiariser avec Jina et Docarray.
Rejoignez notre communauté Discord et discutez avec d'autres membres de la communauté sur les idées.
Rejoignez notre ingénierie toutes les mains se rencontrent pour discuter de votre cas d'utilisation et apprenez les nouvelles fonctionnalités de Jina.
- Quand? Le deuxième mardi de chaque mois
- Où? Zoom (voir notre calendrier des événements publics / .ical) et diffuser en direct sur YouTube
Abonnez-vous aux derniers tutoriels vidéo sur notre chaîne YouTube

Se joindre à nous

Le flux de Dall · e est soutenu par Jina AI et sous licence sous Apache-2.0. Nous embauchons activement des ingénieurs d'IA, des ingénieurs de solution pour construire le prochain écosystème de recherche neuronale en open source.

Développer

dalle flow

Usage

Mises à jour

Galerie

Client

Étape 1: Générer via Dall · e Mega

Étape 2: Sélectionnez et raffinement via GLID3 XL

Étape 3: Sélectionnez et haut de gamme via Swinir

Serveur

Exigences matérielles

Architecture de serveur

Poids de diffusion stables

Courir dans Docker

Image préconçue

Construisez-le vous-même

Récipient à parcourir

Instructions spéciales pour la diffusion stable et Docker

Courir nativement

Dépositions de clonage

Installer des reposs auxiliaires

Installer le flux

Démarrer le serveur

Utilisez le clip comme service

Soutien

Se joindre à nous

GitHub sgrebnov/cordova plugin background download

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

Version mobile de Color Flow 3D

COULER

L'expérience de flux

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf