Impresionante difusión estable
Esta es una lista de software y recursos para el modelo de AI de difusión estable.
- Marca contenido que requiere registro o creación de cuentas para un servicio de terceros fuera de Github.
- ❓ Marca contenido con condiciones de licencia poco claras (por ejemplo, falta de licencia en GitHub)
- ? Marca contenido no libre: contenido comercial que puede requerir cualquier tipo de pago.
Debido a la naturaleza de movimiento rápido del tema, las entradas en la lista pueden eliminarse a una velocidad acelerada hasta que el ecosistema madure.
Ver contribuyente.
Tl; Dr
La forma más fácil de comenzar para la mayoría de las personas es elegir una de las GUI disponibles en función de la plataforma deseada y seguir sus instrucciones de instalación.
Alternativamente, la mayoría de las horquillas más desarrolladas (como Invokeai) vienen con sus propias interfaces de usuario.
Para ponerse en funcionamiento, uno generalmente necesita:
- Una instalación basada en GUI o CLI en una plataforma compatible (generalmente GPU NVIDIA pero admite Silicon Apple, GPU AMD e incluso CPU en algunas ramas)
- Los pesos (archivos .ckpt) para el modelo descargado de Huggingface
- Suficiente RAM/VRAM disponible en el sistema.
Recursos oficiales
- Notas de lanzamiento de Difusión Estable 2.1 - Notas de lanzamiento de difusión estable 2.1.
- https://github.com/stability-ai/Stablediffusion - Oficial Stability AI Estable Difusión 2.1 Lanzamiento.
- Difusión COMPVIS/Estable: la liberación oficial de difusión estable que incluye una CLI, un clasificador de seguridad basado en IA, que detecta y suprime el contenido sexualizado, y todos los archivos necesarios para funcionar.
- Stability-AI/Stability-SDK: el SDK oficial utilizado para construir aplicaciones de Python integradas con la plataforma en la nube de StabilityAI en lugar de alojar el modelo localmente. La operación requiere una clave API (?).
- Anuncio de lanzamiento público: anuncio de StabilityAi sobre el lanzamiento público de la difusión estable.
- Discordia oficial: la discordia de difusión estable oficial por estabilidadi.
- Laion -Aesthetic: el conjunto de datos usó la difusión estable del tren, útil para consultar para ver si se representa un concepto.
Tenedores y contenedores mantenidos activamente
Todas las horquillas enumeradas aquí agregan características y optimizaciones adicionales y generalmente son más rápidas que la versión original, ya que mantienen el modelo en la memoria en lugar de recargarlo después de cada indicador. La mayoría de las horquillas parecen eliminar el clasificador de seguridad que puede presentar un riesgo si se usa para proporcionar servicios públicos, como bots de discordia. Los dos horquillas más populares en este punto son automáticos1111 e invokeai
ABDBARHO/STABLE-DIFLUSION-WEBUI-DOCKER-Configuración de Docker fácil para SD con múltiples opciones de interfaz de usuario fáciles de usar que incluyen Automatic11111/Stable-Diffusion-Webui, SD-Webui/Estable-Diffusion-Webui e Invoke-AI/Invokeai.
Automatic1111/estable-difusión-webui: probablemente la rama más rápida y rica en el momento más rápido en este momento. La interfaz de usuario con sede en Gradio con características extensas como In y Ex superación, vistas previas, parcelas XY, compensación, interrogación clip, inversión textual, indicación negativa, una variedad de características de escala, capacitación, fusión de control de control y capacidades de conmutación y más. Viene con un práctico script de instalación que se encarga de la mayoría de las dependencias y complementos.
Difusión Basujindal/Estable-"Difusión estable optimizada": una horquilla con requisitos VRAM dramáticamente reducidos a través de la división del modelo, lo que permite la difusión estable en tarjetas gráficas de gama baja; Incluye una interfaz web de Gradio y soporte para indicaciones ponderadas.
bes -dev/stable_diffusion.openvino: una horquilla para ejecutar el modelo usando una CPU compatible con OpenVino.
DreamArtist: con solo una imagen de entrenamiento, Dreamartist aprende el contenido y el estilo en él, generando diversas imágenes de alta calidad con alta capacidad de control. Los incrustaciones de DreamArtist se pueden combinar fácilmente con descripciones adicionales, así como dos incrustaciones aprendidas. (Versión independiente)
Difusión de estable rápido: horquilla centrada en la velocidad con la integración de Dreambooth.
Gauss - Aplicación de difusión estable de macOS nativo.
Imaginary - Generación pitónica de imágenes de difusión estable. Único en el que admite un enmascaramiento complejo basado en texto. Tiene una CLI interactiva, compensación, mejora de la cara, mosaico y otras características estándar. Sin gui.
Invoke -AI/Invokeai - (anteriormente conocido como Lstein/Estable -Diffusion) - Horquina muy activa agregando una CLI conversacional, interfaz web básica y soporte para GFPGAN, ESRGAN, CODEFORMER, PREPONTAS PESUDADAS, MEDICIBA PROBLE inversión textual e inferencia en Apple M1.
KERASCV STABLEDFUSION - Implementación de alto rendimiento de difusión estable en Kerascv.
Nicklucche/Estable-Diflusion-Nvidia-Docker-Multi (NVIDIA) Configuración de Docker Capable de SD de SD
Replicada/COPG-Estable-Difusión-Contenedor de aprendizaje automático COG de SD V1.4.
Estable-Diflusion-Jupyterlab-Docker: una configuración de Docker lista para ir con cuadernos Jupyter para difusión estable.
RunwayML/Estable -Difusión: rama de difusión estable por Runwayml con un modelo de interna de entrenamiento específicamente para la entrada de alta calidad.
Ramas potencialmente obsoletas/menos activas
Estas ramas no se han actualizado en más de un meses y se mantienen aquí con fines históricos.
- Neonsecret/Difusión estable: tenedor de bifurcación que se centra en resoluciones más grandes con menos VRAM a expensas de la velocidad, ajustándose automáticamente a las habilidades de las GPU. También incluye compensación, restauración facial a través de CodeFormer y UI personalizada
Puntos de control y pesos
Los puntos de control (archivos .ckpt) deben descargarse por separado y deben ejecutar difusión estable. El último lanzamiento de AI de estabilidad es 2.1. El último modelo que contiene conceptos NSFW fue 1.5 lanzado por Runwayml.
Para las versiones de 2.X, hay un modelo de resolución de resolución de 768x768px capacitado en el modelo base (512x512 píxeles). Necesita uno de estos modelos para usar difusión estable y generalmente desea elegir el último que se adapte a sus necesidades.
- Tarjetas modelo SD -2.1 (768x768px) - Tarjetas/pesos modelo para la difusión estable 2.1 (difusión, compensación e interferencia de puntos de control)
- Tarjetas de modelo base SD-2.1 (512px512px)-Tarjetas/pesos modelo para la difusión estable 2.1 (difusión, compensación e entrada de puntos de control) https://huggingface.co/stabilityai/stable-diffusion-2-1-base
- Tarjetas modelo SD -2.0 - Tarjetas/pesos modelo para la difusión estable 2.0 (difusión, compensación e interferencia de puntos de control)
- SD-V1-5 de Runwayml-Punto de control de difusión estable 1.5 liberado por Runwayml.
- Tarjeta de modelo oficial 1.5 - Tarjeta de modelo de AI de estabilidad oficial en la cara de abrazo con todas las versiones del modelo. La descarga requiere inicio de sesión y aceptación de los términos de servicio.
- Estable-Diflusion-V-1-4-Original.Chkpt-La tarjeta del modelo 1.4 original
- Modelos RealSrgan - Ubicación de descarga para los últimos modelos RealSrgan requeridos para usar las características de ampliación implementadas por muchos tenedores. Existen diferentes modelos para el contenido realista y de anime. Consulte la documentación de la horquilla para identificar las
- SD-V1-5 Inpainting desde Runwayml-Punto de control optimizado para la invención en SD 1.5, lanzado por Runwayml.
Demostraciones y cuadernos en línea
- Huggingface/StabilityAi: la demostración oficial de los espacios de Huggingface.
- ? COLAB OFICAL: el COLAB oficial y optimizado para ejecutar SD en Google Cloud. Debido a los requisitos de VRAM requirió que Colab Pro cree imágenes.
- Andreasjansson/Estable-Difusión-Animación: animar entre las indicaciones.
- Deforum: cuaderno avanzado para difusión estable con animaciones 2D, 3D, entrada de video e interpolación. Incluye ingenio, lotes rápidos y más.
- Interpolación de difusión estable: una implementación simple de generación de imágenes interpoladas (Colab)
- Huggingface/Diffuse -the -Rest - Difuse el resto - img2img de bocetos simples o imágenes cargadas.
Modelos y herramientas complementarias
Herramientas y modelos para su uso en conjunción con difusión estable
- Repositorio de modelos Civitai: repositorio para modelos personalizados e incrustaciones de inversión textual.
- Aplicado a la solicitud: implementación no oficial de control de atención cruzada para la edición de imagen de inmediato.
- SD-ProMPT-Graph: esta es una GUI del editor de curva basado en React para animaciones de interpolación rápidas hechas con difusión estable.
- DAAM: mapas de atribución de atención de difusión, que generan mapas de calor que modelan el impacto de términos y tokens específicos en la solicitud en el resultado final de difusión.
- SD-Concepts-Bibrary: una biblioteca de incrustaciones de inversión textual creada por el usuario para agregar nuevos conceptos a la difusión estable
Capacitación
Dreambooth-Stable-Difiusion-Implementación del Dreambooth de Google para la difusión estable, lo que permite ajustar el modelo para conceptos específicos.
Lora-Lora (adaptación de bajo rango) para el ajuste fino de difusión de texto a imagen más rápido (UNET+Clip), un método de ajuste fino más rápido y eficiente que requiere menos RAM que Dreambooth. Demostración de Huggingface aquí.
Sintonizador estable: sintonizador estable, un entrenador Dreambooth fácil de instalar con una interfaz de usuario muy cómoda.
Entrenador de difusión estable: entrenador de difusión estable con tamaño de conjunto de datos escalable y uso de hardware. Requiere 10 g de VRAM.
Inversión textual: adición de contenido personalizado a difusión estable sin reentrenar el modelo (Paper, Paper2).
Dreamfusion estable - Implementación de texto a 3D Dreamfusion basada en la difusión estable.
Guis
La mayoría de estas GUI, a menos que se mencione lo contrario en su documentación, incluyen difusión estable.
? Flujo de trabajo Auto SD: una interfaz de usuario para Lstein/Stable-Diffusion's Dream.py con UX optimizado para el flujo de trabajo a gran escala/producción alrededor de la síntesis de imágenes. Tutorial de video.
Carefree Creator (versión local) - GUI fácil de usar con un flujo de trabajo centrado en el creador/artista.
CMDR2/STABLE-DIFLUSION-UI-Otro, simple UI para usar para Windows y Linux.
DiffusionBee - Aplicación binaria autónoma para macOS.
DiffusionUi - UI web realizada con Vue.js inspirados en Dall -E usando difusores, perfecto para la entrada. Demostración de video
Kiri.Art (anteriormente SD-MUI)-PWA móvil primero con múltiples modelos (incluida la difusión Waifu). Ejecute gratis localmente o use créditos gratuitos y pagados en el sitio en vivo. Construido con react + materialui. (Código fuente) TypeScript MIT License
? NMKD GUI - UI de Windows, totalmente destacada. Código cerrado. Elija su propio precio.
SD-Webui/Stable-Diffusion-Webui: una horquilla muy activa con UI de Gradio opcional y altamente característica y soporte para TXT2Img, Inpenación IMG2Img, GFPGAN, ESRGAN, indicaciones ponderadas, versión de memoria baja optimizada, inversión textual opcional y más.
Difusión estable Grisk GUI - Windows GUI Binary para SD. Código cerrado, así que use bajo su propio riesgo.
Infinito de difusión estable: una prueba de concepto para superar a una interfaz de lienzo infinita. (requiere una poderosa GPU).
Fusión inestable: una interfaz de escritorio de difusión estable con entrada, img2img y más
Estable-Difusión-Webui-Docker: un frontend basado en Docker que integra las horquillas más populares.
Synesthetic: el motor de búsqueda y el generador de búsqueda enfocados en la remezcla
Escala
- Basicsr: caja de herramientas de restauración y restauración de código abierto que admite varios modelos.
- BSRGAN - BSRGAN - Otra solución de ampliación especializada en imágenes degradadas de aumento.
- Cupscale - GUI para ejecutar varios modelos de escala, incluidos Esrgan y Realesrgan.
- Realesrgan - ESRGAN Upscaling (2x, 4x) y restauración de contenido. Python:
pip install realesrgan - JQUEESNELLE/TXT2IMGHD: un puerto del modo Gobig desde ProgrockDiffusion, proporcionando un aumento de alta calidad en la parte superior de TXT2IMG.
- Base de datos de modelos Wiki de lujo: Wiki y base de datos de modelos para puntos de control compatibles con Esrgan et al.
Restauración de contenido
- Cleaner de Lama: herramienta de entrada de contenido de IA consciente de IA útil para eliminar objetos o defectos no deseados de las imágenes. Python:
pip install lama-cleaner - GFPGAN - Restauración de la cara GaN incluida en varias horquillas para fijar automáticamente la deformación facial comúnmente encontrada en la salida SD.
- CodeFormer: otro modelo de restauración facial (papel).
Encadenamiento
- Chainner - Editor gráfico basado en nodos para encadenar tareas de procesamiento de imágenes.
- AI-Art-Generator-Suite de generación de arte AI que combina difusión estable y otros modelos para la generación de arte de alto volumen.
- Servidor de tuberías de Backend AI distribuido DFServer para construir un clúster de GPU distribuido autohospedado para ejecutar la difusión estable y varias imágenes de IA o modelo de edificio rápido.
Edificio rápido
Las indicaciones son las instrucciones dadas a los modelos de difusión para manipular su salida.
Libro de inmediato de difusión estable - Libro de indicador de difusión estable de OpenAI, un recurso muy completo sobre ingeniería rápida.
ai-art.com/modifiers: una guía de referencia visual para palabras clave.
aiprompptguide.com - Base de datos visual de estilos, modificadores, artistas y personas
AITRANSFORMADOR ADRICIO BUILOR: Ayuda a construir un texto de texto intuitivamente utilizando una herramienta de imagen a texto para generar descripciones de texto detalladas a partir de la imagen, y más de 800 términos de inversión textuales especiales y términos genéricos a menudo utilizados con imágenes de muestra.
Krea.ai: un motor de búsqueda indicado que también recomienda indicaciones similares a la que hace clic.
- Con la creación de cuentas, puede gustar y guardar indicaciones en sus propias colecciones.
LEXICA.ART: una base de datos visual de imágenes y la configuración de indicaciones utilizadas para crearlas.
PharmapsyChotic/Clip -Interrogator - Jupyter Notebook utiliza modelos de clip para sugerir una solicitud de imágenes similares a una imagen dada (demostración).
Phraser: un constructor de inmediato visual que se basa en una base de datos de ejemplos. (Requiere la creación de cuentas)
Promettero = otro constructor de avisos visuales y biblioteca de referencia.
Promotomania: una herramienta de construcción de inmediato visual.
ROM1504/Clip -Retrieval: busca palabras clave rápidas en los conjuntos de datos utilizados en la formación de difusión estable y otros modelos (GUI en línea). Algunas GUI como Automatic1111 incluyen esta funcionalidad.
Generador de información de difusión estable: da sugerencias para mejorar un mensaje de texto dado.
ProntSearch: otro motor de búsqueda de difusión estable pero con API pública
La misma energía: un motor de búsqueda visual que devuelve imágenes que tienen la misma 'energía'.
PublicPrompts - Colección de PublicPrompts
Cascos de uso especializados
- Texturas de los sueños: un complemento de licuador que aprovecha la difusión estable para la creación de texturas.
- Stable-DreamFusion: una implementación de código abierto del papel de Texto a 3D Dreamfusion de Google con ImageGen reemplazado por difusión estable.
Tutoriales y comparaciones
Tutoriales y recursos educativos de alta calidad
Ponerse en funcionamiento
- Difusión estable Cómo: un tutorial básico sobre la difusión estable en funcionamiento.
- Instalación en Windows: una guía sobre la instalación y la difusión estable en Windows.
- Ejecutando en M1 Apple Silicon - Reddit hilo con instrucciones sobre la ejecución de difusión estable en la CPU de Apple M1 y GPU.
- Difusión estable fácil de CPU: una guía sobre la configuración de la difusión estable de solo CPU para GNU/Linux sin tirar el sistema con dependencias.
- "Ultimate GUI Retard Guide" - Tutorial para instalar la bifurcación SD -Webui.
Aprender y masterizar
- Difusión estable Registros Akashic: una lista completa de guías, estudios, palabras clave, indicaciones y artistas.
- Sunny's Tips & Tricks: consejos y trucos SD de Sunny's Google Doc con muchas comparaciones visuales e información útil.
- Comparación del generador de imágenes AI: una comparación visual entre Dall -E, difusión estable y Midjourney por petapixel.com.
- Obtener excelentes resultados en la difusión estable: una guía sobre la generación de imágenes que no apestan.
- Difusión estable ilustrada: una imprimación ilustrada sobre cómo funciona la difusión estable.
- Aprendizaje profundo práctico para codificadores: curso de alta calidad por Fast.Ai dirigido a codificadores que cubre muchos aspectos del aprendizaje profundo, incluida la difusión estable.
- Los mejores artistas SD - Lista de búsqueda de artistas conocidos por difusión estable con imágenes de ejemplo.
Estudios
- Estudios de modificadores: estudio visual de modificadores/palabras clave populares.
- Estudios de artistas - Estudio visual de varios artistas.
Extendiendo la funcionalidad
- Construyendo un bot de discordia SD: un tutorial sobre la construcción de un bot de discordia de difusión estable usando Python.
Recursos comunitarios
- 1 semana de difusión estable: una lista curada de servicios de difusión estables, adaptaciones, interfaces de usuario e integraciones.
- Pharmapsychotic.com/tools: una lista curada de herramientas y recursos para el arte de IA, que incluye, entre otros, la difusión estable.
- Recursos de difusión estables: un recurso exhaustivo para responder preguntas apremiantes sobre la difusión estable, incluidas guías, tutoriales y el mejor software.
Redes sociales
- R/STABLEDIFUSION - Subreddit de difusión estable. (Semioficial)
- R/SDFORALL - SDFORALL
- Pulso de difusión - Boletín de difusión estable semanal
Complementos para aplicaciones de terceros
- Plugin de licuadora: complemento para la licuadora de software de modelado 3D gratuita
- Complemento GIMP - complemento GIMP.
- Plugin Krita: un complemento Krita y GIMP SD
- Plugin KRITA 5.0: otro complemento KRITA basado en la popular horquilla Automatic1111.
- Photoshop Plugin - SD para Photoshop (Adobe Exchange)
SaaS y aplicaciones comerciales que implementan difusión estable
- ? AI Art Generator (iOS) - Aplicación iOS para generar arte utilizando difusión estable.
- AiimageGenerator.org - Generador de arte en línea gratuito para generar imágenes utilizando difusión estable. Admite la generación e interpena TXT2IMG e IMG2IMG.
- Aitransformer: herramientas gratuitas de transformación de imagen/video en línea, que incluye súper estilizador basado en difusión estable, admite TXT2Img, IMG2Img e IMG2TXT (clip -Interrogator).
- ? Barium.AI - Genere texturas PBR (representación basada en física) del texto. Planes gratuitos y pagados.
- ? Servicio de texto a imagen de Canva-Texto a imagen (beta) desde Canva
- ? Dream Studio - Servicio de generación de arte en línea de Stabilityai, los creadores de la difusión estable. Similar a servicios como Dall-E o MidJourney, esto opera en un modelo de crédito con una asignación gratuita de créditos otorgados a los usuarios registrados mensualmente.
- ? Dream.ai - Servicio de generación de arte en línea de Wombo.ai (aplicaciones móviles disponibles).
- ? Gimmeapis - Servicio de difusión estable API REST de terceros.
- ? Computadora de imagen: servicio fácil de usar dirigido a personas no técnicas (viene con créditos de prueba gratuitos)
- ? Neural. Love: otro generador de arte en línea con generosos créditos gratuitos a partir de octubre de 2022.
- ? Difusión estable de replicate.com: otra oferta SaaS para difusión estable.
- ? AI Starry (iOS) - Otra aplicación de iOS que ofrece difusión estable con estilos de arte preestablecidos.
- Horda estable: clúster de difusión estable distribuido (piense en plegarse@home) con interfaces web, discordia y telegrama donde unir con su GPU le brinda prioridad.
- ? Difusión estable como API - API REST de terceros en el servicio de difusión de tabla.
El ático - enlaces anteriores, retirados por inactividad
- Lowfuel/Progrock -Stable: tenedor con GUI web opcional y un enfoque diferente para la escala (Gobig/Esrgan)
- Txt2Imghd - Horne de difusión de programación que crea imágenes detalladas de alta resolución al generar primero una imagen a partir de una solicitud, lo que lo escala, luego ejecutando img2Img en piezas más pequeñas de la imagen elevada, y combinando los resultados en la imagen original.