Génial diffusion stable
Il s'agit d'une liste de logiciels et de ressources pour le modèle stable de diffusion AI.
- marque le contenu qui nécessite une inscription ou une création de compte pour un service tiers en dehors de GitHub.
- ❓ marque le contenu avec des conditions de licence peu claires (par exemple, le manque de licence sur GitHub)
- ? marque un contenu non libre: contenu commercial qui peut nécessiter tout type de paiement.
En raison de la nature rapide du sujet, les entrées de la liste peuvent être supprimées à un rythme accéléré jusqu'à ce que l'écosystème mûrit.
Voir contribution.
Tl; dr
Le moyen le plus simple de commencer pour la plupart des gens est de choisir l'une des GUIS disponibles en fonction de la plate-forme souhaitée et de suivre ses instructions d'installation.
Alternativement, la plupart des fourchettes les plus développées (comme invokeai) sont livrées avec leurs propres interfaces utilisateur.
Pour se mettre en service, il faut généralement:
- Une installation GUI ou CLI sur une plate-forme prise en charge (généralement NVIDIA GPU mais la prise en charge de l'Apple Silicon, des GPU AMD et même du processeur existe dans certaines branches)
- Les poids (fichiers .ckpt) pour le modèle téléchargé à partir de Huggingface
- Suffcent RAM / VRAM disponible sur le système.
Ressources officielles
- Diffusion stable 2.1 Remarques de libération - Diffusion stable 2.1 Notes de libération.
- https://github.com/stability-ai/stablediffusion - STABILITÉ OFFICIELLE STABLE DIFUSION 2.1 Release.
- CompVis / Diffusion stable - la libération officielle de diffusion stable, y compris une CLI, un classificateur de sécurité basé sur l'IA, qui détecte et supprime le contenu sexualisé, et tous les fichiers nécessaires pour fonctionner.
- Stabilité-AI / Stabilité-SDK - Le SDK officiel avait utilisé pour créer des applications Python intégrées à la plate-forme cloud de Stabilityai au lieu d'héberger le modèle localement. L'opération nécessite une clé API (?).
- Annonce de libération publique - Annonce de Stabilityai sur la libération publique de la diffusion stable.
- Discord officiel - La discorde de diffusion stable officielle de Stabilityai.
- LAION-ESESTHÉTÉ - L'ensemble de données a utilisé la diffusion stable du train, utile pour interroger pour voir si un concept est représenté.
Fourchettes et conteneurs entretenus activement
Toutes les fourches répertoriées ici ajoutent des fonctionnalités et des optimisations supplémentaires et sont généralement plus rapides que la version originale, car ils gardent le modèle en mémoire plutôt que de le recharger après chaque invite. La plupart des fourches semblent supprimer le classificateur de sécurité qui peut présenter un risque s'ils sont utilisés pour fournir des services orientés publics, tels que Discord Bots. Les deux fourches les plus populaires à ce stade sont Automatic1111 et invokeai
Abdbarho / stable-diffusion-webui-docker - Configuration facile Docker pour SD avec plusieurs options d'interface utilisateur conviviales, y compris Automatic1111 / stable-diffusion-webui, sd-webui / stable-diffusion-webui et invoke-a / invokeai.
Automatic1111 / stable-diffusion-webui - probablement la branche la plus rapide, la plupart riches en ce moment. Interface utilisateur basée sur Gradio avec des fonctionnalités étendues telles que dans et la surfusion, les aperçus, les intrigues XY, la mise à l'échelle, l'interrogatoire de clip, l'inversion textuelle, les incitations négatives, une variété de fonctionnalités de mise à l'échelle, de formation, de fusion et de capacités de commutation et plus encore. Livré avec un script d'installation pratique qui s'occupe de la plupart des dépendances et des addons.
Basujindal / stable-Diffusion - "Diffusion stable optimisée" - une fourche avec des exigences VRAM considérablement réduites par la division du modèle, permettant une diffusion stable sur les cartes graphiques bas de gamme; Comprend une interface Web Gradio et une prise en charge des invites pondérées.
BES-DEV / STABLE_DIFFUSION.OpenVino - Une fourche pour exécuter le modèle à l'aide d'un CPU compatible avec OpenVino.
Dreamartist - Avec une seule image de formation, Dreamartist apprend le contenu et le style, générant diverses images de haute qualité avec une contrôlabilité élevée. Des intégres de rêveartistes peuvent être facilement combinés avec des descriptions supplémentaires, ainsi que deux incorporations apprises. (version autonome)
DIFFUSION FAST-STABLE - Fork axé sur la vitesse avec intégration Dreambooth.
Gauss - Application de diffusion stable macOS native.
Imaginairy - Génération pythonique d'images de diffusion stables. Unique en ce qu'il prend en charge un masquage à base de texte complexe. A une CLI interactive, une augmentation, une amélioration du visage, un carrelage et d'autres fonctionnalités standard. Pas de GUI.
invoke-a / invokeai - (anciennement connu sous le nom de lstein / stable-diffusion) - fourche très active ajoutant un CLI conversationnel, une interface Web de base et une prise en charge de GFPGAN, ESRGAN, CodeFormer, invites pondérées, mélange invite, demande négative, IMG2IMG, Tiling, l'inversion textuelle ainsi que l'inférence sur Apple M1.
KERASCV STATIFUSION - Implémentation haute performance de la diffusion stable sur KERASCV.
Nicklucche / stable-diffusion-nvidia-docker - Multi (nvidia) GPU Capable Docker Configuration de SD
Réplication / COPG-stable-Diffusion - COG Machine Learning Container de SD v1.4.
stable-diffusion-jupyterlab-docker - une configuration docker prête à aller avec des cahiers jupyter pour une diffusion stable.
RunwayML / stable-Diffusion - Branche de diffusion stable par RunwayML avec un modèle de détention spécifiquement formé pour une intervention de haute qualité.
Branches potentiellement périmées / moins actives
Ces succursales n'ont pas été mises à jour depuis plus d'un mois et sont conservées ici à des fins historiques
- Neonsecret / stable-diffusion - Fork se concentrant sur des résolutions plus importantes avec moins de VRAM au détriment de la vitesse, en s'adaptant automatiquement aux capacités des GPU. Comprend également la mise à l'échelle, la restauration faciale via CodeFormer et une interface utilisateur personnalisée
Points de contrôle et poids
Les points de contrôle (fichiers .ckpt) doivent être téléchargés séparément et doivent exécuter une diffusion stable. La dernière version de stabilité de la stabilité est de 2,1. Le dernier modèle contenant les concepts NSFW était de 1,5 publié par RunwayML.
Pour les versions 2.x, il existe un modèle capable de résolution 768x768px formé du modèle de base (512x512 pixels). Vous avez besoin d'un de ces modèles pour utiliser une diffusion stable et vous souhaitez généralement en choisir le dernier qui correspond à vos besoins.
- Cartes de modèle SD-2.1 (768x768px) - Cartes / poids de modèle pour diffusion stable 2.1 (diffusion, augmentation des points de contrôle et découpage)
- Cartes de modèle de base SD-2.1 (512px512px) - Cartes / poids de modèle pour diffusion stable 2.1 (diffusion, augmentation et points de contrôle des intrave
- Cartes de modèle SD-2.0 - Cartes / poids de modèle pour la diffusion stable 2.0 (diffusion, augmentation des points de contrôle et découpage)
- SD-V1-5 de RunwayML - STABLE DIFUSION 1.5 Point de contrôle publié par RunwayML.
- Carte officielle du modèle 1.5 - Carte de modèle AI de stabilité officielle sur le visage étreint avec toutes les versions du modèle. Le téléchargement nécessite la connexion et l'acceptation des conditions d'utilisation.
- stable-diffusion-v-1-4-original.chkpt - la carte du modèle 1.4 original
- Modèles Reresrgan - Téléchargez l'emplacement pour les derniers modèles Reresrgan requis pour utiliser les fonctionnalités de mise à l'échelle implémentées par de nombreuses fourches. Différents modèles existent pour un contenu réaliste et anime. Veuillez vous référer à la documentation de la fourche pour identifier celles que vous
- SD-V1-5 INPESSIONNAIRATION DE RUNWAYML - Point de contrôle optimisé pour l'instruction sur SD 1.5, publié par RunwayML.
Démos et cahiers en ligne
- HuggingFace / Stabilityai - La démo officielle sur les espaces de câlins.
- ? Colab officiel - Le Colab officiel et optimisé pour exécuter SD sur Google Cloud. En raison des exigences VRAM, Colab Pro a obligé des images.
- Andreasjansson / stable-diffusion-animation - animer entre les invites.
- Deforum - Carnet avancé pour une diffusion stable avec des animations 2D, 3D, une entrée vidéo et des animations d'interpolation. Comprend la déainte, un lot rapide, et plus encore.
- Interpolation de diffusion stable - AA Implémentation simple de la génération d'images N interpolées (Colab)
- HuggingFace / diffuse-the-rest - diffusez le reste - img2img à partir de sketches simples ou d'images téléchargées.
Modèles et outils complémentaires
Outils et modèles à utiliser en conjonction avec une diffusion stable
- Référentiel du modèle Civitai - Référentiel pour les modèles personnalisés et les incorporations d'inversion textuelles.
- Invite à invite - implémentation non officielle du contrôle de l'attention croisée pour l'invite pour installer l'édition d'images.
- SD-PROMPT-GRAPH - Il s'agit d'une interface graphique d'éditeur de courbe basée sur la réaction pour les animations d'interpolation rapides faites avec une diffusion stable.
- DAAM - Cartes d'attribution d'attention de diffusion, générant des cartes thermiques modélisant l'impact de termes et de jetons spécifiques dans l'invite sur le résultat de diffusion final.
- SD-Concepts-Library - Une bibliothèque d'intégration d'inversion textuelle créée par l'utilisateur pour ajouter de nouveaux concepts à une diffusion stable
Entraînement
Dreambooth-stable-Diffusion - Implémentation de Dreambooth de Google pour une diffusion stable, permettant un réglage fin du modèle pour des concepts spécifiques.
LORA - LORA (adaptation de faible rang) pour une diffusion de diffusion de texte à l'image plus rapide (unt + clip), une méthode de réglage fin plus rapide et plus efficace nécessitant moins de RAM que Dreambooth. Démo en câlins ici.
Tourner stable - Tourner stable, un entraîneur Dreambooth facile à installer avec une interface utilisateur très confortable.
Entraîneur de diffusion stable - entraîneur de diffusion stable avec taille de données évolutive et utilisation du matériel. Nécessite 10 g de VRAM.
Inversion textuelle - ajout de contenu personnalisé à une diffusion stable sans recycler le modèle (papier, papier2).
Stable DreamFusion - Texte à la mise en œuvre de DreamFusion 3D basé sur une diffusion stable.
Gigogne
La plupart de ces GUIS, sauf indication contraire dans leur documentation, incluent une diffusion stable.
? Auto SD Workflow - une interface utilisateur pour LSTEIN / stable-diffusion's dream.py avec UX optimisé pour le flux de travail à grande échelle / de production autour de la synthèse d'image. Video pas à pas.
Creator Creator (version locale) - GUI convivial avec un flux de travail centré sur le créateur / artiste.
CMDR2 / STABLE-DIFUSION-UI - Un autre, simple à utiliser l'interface utilisateur pour Windows et Linux.
DiffusionBee - Application binaire auto-contenue pour macOS.
DiffFusionUi - UI Web fabriqué avec Vue.js inspiré par Dall-E à l'aide de diffuseurs, parfait pour la déception. Démo vidéo
Kiri.art (anciennement SD-MUI) - PWA-First mobile avec plusieurs modèles (diffusion incl. Waifu). Exécutez gratuitement localement ou utilisez des crédits gratuits et payants sur le site en direct. Construit avec React + MaterialUi. (Code source) MIT License TypeScript
? NMKD GUI - Windows UI, entièrement en vedette. Source fermée. Choisissez votre propre prix.
SD-webui / stable-diffusion-webui - fourche très active avec une interface utilisateur de gradio en option et hautement très fonctionnante pour TxT2IMG, IMG2IMG, l'intervention, GFPGAN, ESRGAN, invites pondérées, version à mémoire basse optimisée, inversion textuelle facultative et plus encore.
GUI STABLE DIFFUSION GRISK - GUI Windows GUI binaire pour SD. Source fermée alors utilisez à vos propres risques.
Infini de diffusion stable - une preuve de concept pour la surface avec une interface infinie en toile. (nécessite un GPU puissant).
Fusion instable - Un frontage de bureau de diffusion stable avec une intrainte, IMG2IMG et plus
stable-diffusion-webui-docker - un frontend basé sur Docker intégrant les fourches les plus populaires.
Synesthésique - moteur de recherche rapide et générateur axé sur le remixage
Augmentation
- BasicsR - boîte à outils de mise à l'échelle et de restauration open-source prenant en charge plusieurs modèles.
- BSRGAN - BSRGAN - Une autre solution de mise à l'échelle spécialisée dans les images dégradées de l'échelle.
- Cupscale - GUI pour exécuter divers modèles de mise à l'échelle, notamment Esrgan et RefeSrgan.
- Reresrgan - Esrgan UpScaling (2x, 4x) et Restoration de contenu. Python:
pip install realesrgan - JQUESNELLE / TXT2IMGHD - Un port du mode Gobig à partir de ProGrockdiffusion, offrant une augmentation de haute qualité au-dessus du txt2img.
- Base de données de modèle Wiki haut de gamme - Base de données Wiki et modèle pour les points de contrôle compatibles avec Esrgan et al.
Restauration de contenu
- Lama-Cleaner - Tool d'insistance AI au courant du contenu utile pour supprimer des objets ou des défauts indésirables des images. Python:
pip install lama-cleaner - GFPGAN - Gan de restauration du visage inclus dans plusieurs fourches pour réparer automatiquement la déformation du visage couramment trouvé dans la sortie SD.
- CodeFormer - Un autre modèle de restauration du visage (papier).
Chaînage des tâches
- Chainer - Éditeur basé sur des nœuds graphiques pour les tâches de traitement d'image à chaîne.
- Générateur AI-Art - Suite de génération d'art AI combinant une diffusion stable et d'autres modèles pour la génération d'art à haut volume.
- DFServer Distribué Backend AI Pipeline Server pour construire un cluster GPU distribué auto-hébergé pour exécuter la diffusion stable et divers modèles d'image AI ou de construction invite.
Bâtiment rapide
Les invites sont les instructions données aux modèles de diffusion pour manipuler leur sortie.
Book invite de diffusion stable - livre d'invite de diffusion stable d'Openai, une ressource très complète sur l'ingénierie rapide.
AI-art.com/modificateurs - Un guide de référence visuelle pour les mots clés.
AipRomptguide.com - Base de données visuelle des styles, modificateur, artistes et personnes
Builder de l'invite Aitransformateur - Aide à créer des invites de texte intuitivement à l'aide d'un outil d'image à texte pour générer des descriptions de texte détaillées à partir de l'image, et plus de 800 termes d'inversion textuelle spéciaux et des termes génériques souvent utilisés avec des exemples d'images.
Krea.ai - Moteur de recherche invite qui recommande également des invites similaires à celle sur laquelle vous cliquez.
- Avec la création de compte, vous pouvez aimer et enregistrer des invites dans vos propres collections.
Lexica.art - une base de données visuelle consultable des images et les paramètres d'invites utilisés pour les créer.
Pharmapsychotic / Clip-interrogateur - Jupyter Notebook utilise des modèles de clip pour suggérer une invite pour des images similaires à une image donnée (démo).
Phraser - Un constructeur d'invite visuelle dessinant sur une base de données d'exemples. (Nécessite la création de compte)
PROMPTHERO = un autre constructeur d'invite visuelle et bibliothèque de référence.
Promptomanie - Un outil de construction visuelle invite.
ROM1504 / CLIP-RETRIEVAL - Recherche des mots clés d'invite dans les ensembles de données utilisés dans la formation de diffusion stable et d'autres modèles (GUI en ligne). Certaines GUIS comme Automatic111 incluent cette fonctionnalité.
Générateur d'invite de diffusion stable - donne des suggestions pour améliorer une invite de texte donnée.
PromptSearch - Encore un autre moteur de recherche de diffusion stable mais avec API publique
Même énergie - un moteur de recherche visuel qui renvoie des images qui ont la même «énergie».
PublicPrompts - Collection de publics publics
Usécases spécialisées
- Textures de rêve - Un addon à mélanges tirant parti de diffusion stable pour la création de texture.
- Stable-DreamFusion - Une implémentation open source du papier DreamFusion de texte à 3D de Google avec Imagegen remplacé par une diffusion stable.
Tutoriels et comparaisons
Tutoriels et ressources éducatives de haute qualité
Se retirer
- Diffusion stable comment - un tutoriel de base sur l'obtention de diffusion stable.
- Installation sur Windows - Un guide sur l'installation et l'exécution de diffusion stable sur Windows.
- Exécution sur le thread M1 Apple Silicon - Reddit avec des instructions sur l'exécution de diffusion stable sur le processeur Apple M1 et le GPU.
- Diffusion stable facile CPU - Un guide sur la configuration de la diffusion stable CPU uniquement pour GNU / Linux sans joncher le système avec des dépendances.
- "Ultimate GUI Retard Guide" - Tutoriel pour installer la fourche SD-Webui.
Apprendre et maîtriser
- STABLE DIFFUSION AKASHIC RECORDS - Une liste complète des guides, des études, des mots clés, des invites et des artistes.
- Tips & Tricks de Sunny - Sunny's SD Conseils et astuces Google avec beaucoup de comparaisons visuelles et d'informations utiles.
- Comparaison du générateur d'images AI - Une comparaison visuelle entre Dall-E, diffusion stable et MidJourney par Petapixel.com.
- Obtenir d'excellents résultats à une diffusion stable - un guide sur la génération d'images qui ne sont pas nuls.
- Diffusion stable illustrée - une amorce illustrée sur le fonctionnement de la diffusion stable.
- Apprentissage en profondeur pratique pour les codeurs - cours de haute qualité par Fast.ai destiné aux codeurs qui couvrent de nombreux aspects de l'apprentissage en profondeur, y compris le diffusion stable.
- Top artistes SD - Liste consultable d'artistes connus par diffusion stable avec des exemples d'images.
Études
- Études de modificateurs - Étude visuelle des modificateurs / mots clés populaires.
- Études d'artistes - Étude visuelle de divers artistes.
Extension des fonctionnalités
- Construire un bot SD Discord - Un tutoriel sur la construction d'un bot de discorde de diffusion stable à l'aide de Python.
Ressources communautaires
- 1 semaine de diffusion stable - une liste organisée de services de diffusion stables, d'adaptations, d'interfaces utilisateur et d'intégations.
- Pharmapsychotic.com/tools - Une liste organisée d'outils et de ressources pour l'art de l'IA, y compris, mais sans s'y limiter, la diffusion stable.
- Ressources de diffusion stables - une ressource approfondie pour répondre aux questions pressantes sur la diffusion stable, y compris les guides, les tutoriels et les meilleurs logiciels.
Réseaux sociaux
- R / STEDIFFUSION - SUBREDDIT DE DIFUSION STABLE. (Semi-officiel)
- r / sdforall - sdforall
- Impulsion de diffusion - newsletter de diffusion stable hebdomadaire
Plugins pour les applications tierces
- Plugin Blender - Plugin pour le logiciel de modélisation 3D gratuit Blender
- Plugin GIMP - Plugin GIMP.
- Plugin Krita - un plugin Krita et Gimp SD
- Plugin Krita 5.0 - Un autre plugin Krita basé sur la populaire fourche Automatic1111.
- Plugin Photoshop - SD pour Photoshop (Adobe Exchange)
SaaS et applications commerciales implémentant une diffusion stable
- ? Générateur d'art AI (IOS) - application iOS pour générer de l'art en utilisant une diffusion stable.
- aiimageGenerator.org - Générateur d'art en ligne gratuit pour générer des images en utilisant une diffusion stable. Prend en charge la génération et la déception TXT2IMG et IMG2IMG.
- Aitransformateur - Outils de transformation d'image / vidéo en ligne gratuits, y compris Super Stylizer basé sur une diffusion stable, prend en charge TXT2IMG, IMG2IMG et IMG2TXT (Clip Interrogator).
- ? Barium.ai - générer des textures PBR (rendu basé sur la physique) à partir de texte. Plans gratuits et payés.
- ? Canva Text-to-Image - Service de texte à image (Beta) de Canva
- ? Dream Studio - Service de génération d'art en ligne par Stabilityai, les créateurs d'une diffusion stable. Semblable à des services comme Dall-E ou MidJourney, cela opère sur un modèle de crédit avec une allocation gratuite de crédits donnée aux utilisateurs inscrits sur une base mensuelle.
- ? Dream.ai - Service de génération d'art en ligne par wombo.ai (applications mobiles disponibles).
- ? GIMMAPIS - Service de diffusion stable API REST à tiers.
- ? Image Computer - Service facile à utiliser destiné aux personnes non techniques (est livré avec des crédits d'essai gratuits)
- ? Neural.love - un autre générateur d'art en ligne avec généreux crédits gratuits en octobre 2022.
- ? Replicate.com Diffusion stable - Une autre offre SaaS pour la diffusion stable.
- ? Starry AI (IOS) - Une autre application iOS offrant une diffusion stable avec des styles d'art prédéfinis.
- Horde stable - Cluster de diffusion stable distribué (pensez à plier @ home) avec des interfaces Web, discorde et télégramme où la rejoindre votre GPU vous donne la priorité.
- ? Diffusion stable comme API - API REST tierce dans le service de diffusion de table.
Le grenier - liens précédents, à la retraite pour l'inactivité
- Lowfuel / Progrock-stable - fourche avec une interface graphique Web en option et une approche différente de la mise à l'échelle (Gobig / Esrgan)
- txt2IMGHD - Fork de diffusion de programme qui crée des images détaillées et à haute résolution en générant d'abord une image à partir d'une invite, en la renforçant, puis en exécutant IMG2IMG sur des morceaux plus petits de l'image à l'échelle et en mélangeant les résultats dans l'image d'origine.