A incrível difusão estável
Esta é uma lista de software e recursos para o modelo de AI de difusão estável.
- Marca o conteúdo que requer inscrição ou criação de contas para um serviço de terceiros fora do Github.
- ❓ marca o conteúdo com condições de licenciamento pouco claras (por exemplo, falta de licença no GitHub)
- ? Marca conteúdo não livre: conteúdo comercial que pode exigir qualquer tipo de pagamento.
Devido à natureza rápida do tópico, as entradas da lista podem ser removidas a uma taxa acelerada até que o ecossistema amadureça.
Veja contribuindo.
Tl; dr
A maneira mais fácil de começar para a maioria das pessoas é escolher uma das GUIs disponíveis com base na plataforma desejada e seguir suas instruções de instalação.
Como alternativa, a maioria dos garfos mais desenvolvidos (como a Invokeai) vem com suas próprias interfaces de usuário.
Para subir e correr, geralmente é necessário:
- Uma instalação baseada em CLI ou GUI em uma plataforma suportada (geralmente a GPU da NVIDIA, mas o suporte para Apple Silicon, AMD GPUs e até CPU existe em algumas filiais)
- Os pesos (arquivos .ckpt) para o modelo baixado do huggingface
- RAM/VRAM suficiente disponível no sistema.
Recursos oficiais
- Difusão estável 2.1 Notas de liberação - Difusão estável 2.1 Notas de liberação.
- https://github.com/stability-ai/stababledIffusion - Estabilidade oficial AI Difusão estável 2.1 Release.
- Difusão Compvis/estável - A liberação oficial de difusão estável, incluindo uma CLI, um classificador de segurança baseado em IA, que detecta e suprime o conteúdo sexual e todos os arquivos necessários para executar.
- Estabilidade-AI/Estabilidade-SDK-O SDK oficial usado para criar aplicativos Python integrados à plataforma em nuvem da StabilityAai, em vez de hospedar o modelo localmente. A operação requer uma chave da API (?).
- Anúncio de lançamento público - O anúncio da Stabilityai sobre a liberação pública de difusão estável.
- Discórdia oficial - a discussão oficial de difusão estável por Stabilityai.
- Laion -Aesthetic - O conjunto de dados usou difusão estável do trem, útil para consultar para ver se um conceito é representado.
Garfos e recipientes mantidos ativamente
Todos os garfos listados aqui adicionam recursos e otimizações adicionais e geralmente são mais rápidos que a versão original, pois mantêm o modelo na memória em vez de recarregá -lo após cada prompt. A maioria dos garfos parece remover o classificador de segurança que pode apresentar um risco se usado para fornecer serviços de volume público, como os bots Discord. Os dois garfos mais populares neste momento são Automatic1111 e Invokeai
Abdbarho/Difusão estável-Docker-Configuração fácil do Docker para SD com várias opções de interface do usuário amigáveis, incluindo Automatic1111/stable-Diffusion-Webui, SD-Webui/Stable-Diffusion-Webui e Invoke-AI/InvokeAi.
Automatic1111/stable-difusão-webui-provavelmente o movimento mais rápido, a maioria apresenta ramos rica no momento. UI baseada em graduação, com recursos extensos, como inspirar e pintar, visualizações, gráficos XY, aumento da escala, interrogatório de clipe, inversão textual, solicitação negativa, uma variedade de recursos de upscaling, treinamento, fusão de pontos de verificação e recursos de comutação e muito mais. Vem com um script de instalação útil que cuida da maioria das dependências e complementos.
Basujindal/estável difusão-"Difusão estável otimizada"-um garfo com requisitos de VRAM reduzidos drasticamente por meio da divisão de modelos, permitindo difusão estável em placas gráficas de extremidade inferior; Inclui uma interface da web gradio e suporte para instruções ponderadas.
bes -dev/stable_diffusion.openvino - um garfo para executar o modelo usando uma CPU compatível com o OpenVino.
DREAMARTIST - Com apenas uma imagem de treinamento DreamArtist, aprende o conteúdo e o estilo, gerando diversas imagens de alta qualidade com alta controlabilidade. As incorporações do DreamArtist podem ser facilmente combinadas com descrições adicionais, além de duas incorporações aprendidas. (versão independente)
Difusão rápida e estável-Forek focado na velocidade com a integração Dreambooth.
Gauss - MacOS nativo App de difusão estável.
imaginairy - geração pitônica de imagens de difusão estável. Único, pois suporta mascaramento complexo baseado em texto. Possui um CLI interativo, aumento da escala, aprimoramento do rosto, ladrilhos e outros recursos padrão. Sem GUI.
Invoke -AI/Invokeai - (anteriormente conhecido como Lstein/Stable -Diffusion) - Garfo muito ativo, adicionando uma CLI conversacional, interface básica da Web e suporte para GFPGAN, ESRGAN, Codeformer, Slowing ponderado, mistura rápida, solicitação negativa, img2Img, ladrilhos, Inversão textual, bem como inferência no Apple M1.
KERASCV STABLABLEFIFUSTION - Implementação de alto desempenho da difusão estável no KERASCV.
Nicklucche/Stable-Diffusion-Nvidia-Docker-Multi (NVIDIA) GPU Cable Docker Configuração de SD
Replicar/CopG-estável-difusão-contêiner de aprendizado de máquina de COG de SD v1.4.
Docker-Jupyterlab-Docker de Difusão estável-Uma configuração do Docker pronta para ir com notebooks Jupyter para difusão estável.
runwayml/stable -difusão - ramo de difusão estável por punwayml com modelo de pintura especificamente treinado para uma pintura de alta qualidade.
Galhos potencialmente obsoletos/menos ativos
Esses ramos não foram atualizados em mais de um mês e são mantidos aqui para fins históricos
- Neonsecret/Stable -Diffusion - Garfo com foco em resoluções maiores com menos VRAM à custa da velocidade, ajustando automaticamente as habilidades de GPUs. Também inclui upscaling, restauração facial via código de código e interface de usuário personalizada
Pontos de verificação e pesos
Os pontos de verificação (arquivos .ckpt) devem ser baixados separadamente e são necessários para executar difusão estável. A versão mais recente da IA de estabilidade é 2.1. O último modelo que contém conceitos de NSFW foi 1,5 lançado pelo RunwayML.
Para liberações 2.x, há um modelo capaz de resolução de 768x768px treinado fora do modelo base (512x512 pixels). Você precisa de um desses modelos para usar difusão estável e geralmente deseja escolher o mais recente que atenda às suas necessidades.
- Cartões de modelo SD -2.1 (768x768px) - Cartões/pesos de modelo para difusão estável 2.1 (Difusão, Upscaling e Painting Points)
- Cartões de modelo base SD-2.1 (512px512px)-Cartões de modelo/pesos para difusão estável 2.1 (Difusão, Upscaling e Painting Points) https://huggingface.co/stabilityi/stable-diffusion-2-base
- Cartões de modelo SD -2.0 - Cartões de modelo/pesos para difusão estável 2.0 (Difusão, Upscaling e Painting Points)
- SD-V1-5 da RunwayML-Difusão estável 1.5 Ponto de verificação lançado pelo RunwayML.
- Cartão de modelo oficial 1.5 - Cartão oficial de modelo de estabilidade AI ao abraçar o rosto com todas as versões do modelo. O download requer login e aceitação dos Termos de Serviço.
- stable-difusão-v-1-4-original.chkpt-o cartão do modelo 1.4 original
- Modelos Realesrgan - Baixe o local para os mais recentes modelos Realesrgan necessários para usar os recursos de upscaling implementados por muitos garfos. Existem diferentes modelos para conteúdo realista e de anime. Consulte a documentação do garfo para identificar os que você
- SD-V1-5 Painting do RunwayML-Ponto de verificação otimizado para inserir no SD 1.5, lançado pelo RunwayML.
Demos e cadernos online
- Huggingface/Stabilityai - A demonstração oficial em espaços Huggingface.
- ? Colab oficial - o Colab oficial e otimizado para executar o SD no Google Cloud. Devido aos requisitos de VRAM exigidos pelo Colab Pro para criar imagens.
- Andreasjansson/Animação de difusão estável-Anima entre os avisos.
- DeForum - Notebook avançado para difusão estável com animações 2D, 3D, de vídeo e interpolação. Inclui pintura, lotes rápidos e muito mais.
- Interpolação de difusão estável - AA simples implementação de gerar n imagens interpoladas (COLAB)
- huggingface/difusa o restaurante - difuso o restante - img2img de esboços simples ou imagens enviadas.
Modelos e ferramentas complementares
Ferramentas e modelos para uso em conjunto com difusão estável
- Repositório de modelos Civitai - repositório para modelos personalizados e incorporação de inversão textual.
- Prompt to Prompt-Implementação não oficial do controle de ataque cruzado para prompt para solicitar a edição de imagens.
- SD-PROMPT-GRAPH-Esta é uma GUI da editora de curva baseada em React para obter animações de interpolação prontas feitas com difusão estável.
- DAAM - Mapas de atribuição de atenção de difusão, gerando mapas de calor modelando o impacto de termos e tokens específicos no prompt no resultado final de difusão.
- Library SD-Concepts-Uma biblioteca de incorporação de inversão textual criada pelo usuário para adicionar novos conceitos à difusão estável
Treinamento
Dreambooth-estável-difusão-Implementação do Dreambooth do Google para difusão estável, permitindo o ajuste fino do modelo para conceitos específicos.
LORA-LORA (adaptação de baixo rank) para ajuste fino mais rápido de difusão de texto para imagem (clipe UNET+), um método de ajuste fino mais rápido e mais eficiente que requer menos RAM do que o Dreambooth. Demo de Huggingface aqui.
Afinador estável - sintonizador estável, um treinador fácil de instalar com uma interface de usuário muito confortável.
Treinador de difusão estável - instrutor de difusão estável com tamanho de conjunto de dados escalável e uso de hardware. Requer 10g de vram.
Inversão textual - Adição de conteúdo personalizado à difusão estável sem recorrer o modelo (Paper, Paper2).
Estável Dreamfusion - Texto para a implementação de Dreamfusion 3D com base na difusão estável.
GUIs
A maioria dessas GUIs, a menos que mencionada de outra forma em sua documentação, inclua difusão estável.
? Auto SD Workflow-uma interface do usuário do Dream.Py de Lstein/Stable-Diffusion com UX otimizado para fluxo de trabalho em larga escala/produção em torno da síntese de imagem. Passo a passo de vídeo.
Criador despreocupado (versão local) - GUI amigável com um fluxo de trabalho Centric Centric.
cmdr2/stable-difusão-UI-Outra, simples de usar a interface do usuário para Windows e Linux.
DifusãoBee - App binário independente para macOS.
DIFLUSUSUI - UI da web feita com vue.js inspirado por dall -e usando difusores, perfeito para pintar. Demoção de vídeo
Kiri.art (anteriormente SD-MUI)-Mobile-primeiro PWA com vários modelos (incluindo difusão de Waifu). Execute gratuitamente localmente ou use créditos grátis e pagos no site ao vivo. Construído com react + materialui. (Código -fonte) MIT License TypeScript
? NMKD GUI - UI do Windows, totalmente em destaque. Fonte fechada. Escolha seu próprio preço.
SD-Webui/Stable-Diffusion-Webui-Garfo muito ativo com interface do graduação opcional e altamente característica e suporte para TXT2IMG, IMG2IMG INPINANTE, GFPGAN, ESRGAN, SOMADOS PESSONADOS, versão de baixa memória otimizada, textual opcional e muito mais.
Difusão estável Gish GUI - Windows Gui binário para SD. Fonte fechada, portanto, use por sua conta e risco.
Infinidade de difusão estável - uma prova de conceito para ultrapassar com uma interface de tela infinita. (requer GPU poderoso).
Fusão instável - um front -end estável para desktop com pintura, img2Img e mais
Docker de Diffusion-Diffusion-Webui-Um front-end baseado em docker que integra os garfos mais populares.
Sinesthetic - Mecanismo de pesquisa rápido e gerador focado em remixar
Upscaling
- BASICSR - Caixa de ferramentas de aumento e restauração de código aberto que suporta vários modelos.
- BSRGAN - BSRGAN - Outra solução de upscaling especializada em imagens degradadas de aumento da escala.
- CupScale - GUI para executar vários modelos de upscaling, incluindo Esrgan e Realesrgan.
- Realesrgan - Esrgan Upscaling (2x, 4x) e restauração de conteúdo. Python:
pip install realesrgan - JQuesnelle/txt2Imghd - Uma porta do modo GOBIG da ProgramDiffusion, fornecendo aumento de alta qualidade no topo do TXT2IMG.
- Banco de dados de modelos wiki upscale - Wiki e Model Database para pontos de verificação compatíveis com Esrgan et al.
Restauração de conteúdo
- LAMA -CLEANTER - Conteúdo consciente da ferramenta de pintura de IA útil para remover objetos ou defeitos indesejados das imagens. Python:
pip install lama-cleaner - GFPGAN - GaN de restauração de rosto incluído em vários garfos para corrigir automaticamente a deformação da face comumente encontrada na saída SD.
- Código - Outro modelo de restauração de rosto (papel).
Encadeamento de tarefas
- Chainner - editor gráfico baseado em nó para encadear tarefas de processamento de imagem.
- AI-ART-Generator-Suíte de geração de arte AI Combinando difusão estável e outros modelos para geração de arte de alto volume.
- O DFServer distribuiu o servidor de pipeline de back-end para criar um cluster de GPU distribuído auto-hospedado para executar a difusão estável e várias imagem de IA ou modelo de construção imediata.
Edifício imediato
Os avisos são as instruções dadas aos modelos de difusão para manipular sua saída.
Livro do prompt de difusão estável - o livro de prompt de difusão estável do OpenAI, um recurso muito abrangente sobre engenharia imediata.
ai-art.com/modifiers - um guia de referência visual para palavras -chave.
AipromptGuide.com - Banco de dados visual de estilos, modificadores, artistas e pessoas
Aitransformer Prompt Builder - Ajude a criar o texto Proot de texto Intuitivamente, usando uma ferramenta de imagem para gerar descrições detalhadas de texto a partir da imagem e mais de 800 termos de inversão textual especial e termos genéricos frequentemente usados com imagens de amostra.
KREA.AI - MECHOR DE PESQUISA PROMUTADA QUE RECOMENDO AS SOMENTOS DE ALGUNS EM QUE QUE QUE QUE QUE QUE QUE QUE CLIQUE.
- Com a criação de contas, você pode gostar e salvar instruções em suas próprias coleções.
LEXICA.ART - Um banco de dados visual pesquisável de imagens e as configurações de prompts usadas para criá -las.
O notebook Pharmapsicótico/Clip -Interroator - Jupyter usa modelos de clipe para sugerir um prompt para imagens semelhantes a uma determinada imagem (demonstração).
Phraser - Um construtor de prompts visuais desenhando um banco de dados de exemplos. (Requer criação de contas)
Prompthero = outro construtor de prompts visuais e biblioteca de referência.
Promptomania - uma ferramenta de construção rápida visual.
ROM1504/REVERVALIZAÇÃO DO CLIP - Pesquisa por palavras -chave rápidas nos conjuntos de dados usados no treinamento de difusão estável e em outros modelos (GUI online). Algumas GUIs como o Automatic1111 incluem essa funcionalidade.
Gerador de prompt de difusão estável - fornece sugestões para melhorar um determinado prompt de texto.
PromptSearch - Mais um mecanismo de pesquisa de difusão estável, mas com API pública
A mesma energia - um mecanismo de busca visual que retorna imagens com a mesma 'energia'.
Publicprompts - Coleção de Provomptos Públicos
Ecaes de usos especializados
- Dream -texuções - Um acúmulo de liquidificador que alavancava difusão estável para criação de textura.
- estável-dreamfusion-uma implementação de código aberto do papel de texto para 3D para 3D do Google com ImageGen substituído por difusão estável.
Tutoriais e comparações
Tutoriais e recursos educacionais de alta qualidade
Subindo e correndo
- Difusão estável Como - um tutorial básico sobre como obter difusão estável em funcionamento.
- Instalando no Windows - um guia sobre a instalação e execução de difusão estável nas janelas.
- Em execução no M1 Apple Silicon - Reddit Thread com instruções sobre a difusão estável na CPU e GPU Apple M1.
- Difusão estável somente para CPU-um guia sobre a configuração de difusão estável somente CPU para GNU/Linux sem espalhar o sistema com dependências.
- "Ultimate GUI Retard Guide" - Tutorial para instalar o garfo SD -Webui.
Aprendendo e domina
- Difusão estável Akashic Records - Uma lista abrangente de guias, estudos, palavras -chave, avisos e artistas.
- Dicas e truques da Sunny - Dicas e truques da Sunny SD Google Doc com muitas comparações visuais e informações úteis.
- Comparação do gerador de imagens da AI - uma comparação visual entre Dall -E, Difusão estável e Midjourney por Petapixel.com.
- Obtendo ótimos resultados na difusão estável - um guia sobre a geração de imagens que não são péssimas.
- Difusão estável ilustrada - um iniciador ilustrado sobre como funciona a difusão estável.
- Aprendizagem profunda prática para codificadores - Curso de alta qualidade pela Fast.Ai destinada a codificadores que abrangem muitos aspectos do aprendizado profundo, incluindo difusão estável.
- Top SD Artists - Lista pesquisável de artistas conhecidos por difusão estável com imagens de exemplo.
Estudos
- Estudos de modificadores - Estudo visual de modificadores/palavras -chave populares.
- Estudos de artistas - Estudo visual de vários artistas.
Estendendo a funcionalidade
- Construindo um Bot Discord SD - Um tutorial sobre a construção de um bot de discórdia de difusão estável usando Python.
Recursos comunitários
- 1 semana de difusão estável - uma lista com curadoria de serviços de difusão estável, adaptações, interfaces de usuário e integrações.
- Pharmapsychotic.com/Tools - Uma lista com curadoria de ferramentas e recursos para a AI Art, incluindo, entre outros, difusão estável.
- Recursos de difusão estáveis - Um recurso completo para responder a perguntas prementes sobre difusão estável, incluindo guias, tutoriais e o melhor software.
Mídia social
- R/STABLABLEFIFUSTION - SUBREDDIT DE DIFUSÃO ESTABLE. (Semi-oficial)
- r/sdforall - sdforall
- Pulso de difusão - boletim de difusão estável semanal
Plugins para aplicativos de terceiros
- Blender Plug -in - Plug -in para o liquidificador de software de modelagem 3D gratuito
- Plug -in GIMP - GIMP Plugin.
- Plug -in KRITA - um plug -in Krita e Gimp SD
- Plugin KRITA 5.0 - Outro plug -in KRITA baseado no popular garfo automático1111111.
- Photoshop Plugin - SD para Photoshop (Adobe Exchange)
SaaS e aplicativos comerciais que implementam difusão estável
- ? Gerador de arte AI (iOS) - aplicativo iOS para gerar arte usando difusão estável.
- aiimageGenerator.org - gerador de arte on -line gratuito para gerar imagens usando difusão estável. Suporta geração e pintura de TXT2IMG e IMG2IMG.
- Aitransformer - Ferramentas de transformação de imagem/vídeo on -line gratuitas, incluindo super estilizador com base em difusão estável, suporta TXT2IMG, IMG2IMG e IMG2TXT (interrogador de clipe).
- ? BARIUM.AI - Gere texturas de PBR (renderização baseada em física) a partir do texto. Planos grátis e pagos.
- ? Canva Text-to-Image-Serviço de texto para imagem (beta) da Canva
- ? Dream Studio - Serviço de geração de arte on -line da Stabilityai, os criadores da difusão estável. Semelhante a serviços como Dall-E ou Midjourney, isso opera em um modelo de crédito com um subsídio gratuito de créditos dados aos usuários assinados mensalmente.
- ? Dream.ai - Serviço de geração de arte on -line por wombo.ai (aplicativos móveis disponíveis).
- ? GIMMEAPIS - Serviço de difusão estável de API de REST de terceiros.
- ? Computador de imagem-serviço fácil de usar destinado a pessoas não técnicas (vem com créditos de avaliação gratuita)
- ? Neural.Love - Outro gerador de arte on -line com créditos gratuitos generosos em outubro de 2022.
- ? Replicar.com Difusão estável - Outra oferta de SaaS para difusão estável.
- ? Starry AI (iOS) - Outro aplicativo iOS que oferece difusão estável com estilos de arte predefinidos.
- Horda estável - cluster de difusão estável distribuído (pense dobrando@home) com interfaces da Web, Discord e Telegram, onde a união com sua GPU oferece prioridade.
- ? Difusão estável como API - API de REST de terceiros no serviço de difusão de tabela.
O sótão - links anteriores, aposentados para inatividade
- LOWFUEL/PROGROCAL - FILHO com GUI da web opcional e uma abordagem diferente para o upscaling (GOBIG/ESRGAN)
- TXT2IMGHD - Fork de difusão de programas que cria imagens detalhadas e de maior resolução gerando primeiro uma imagem a partir de um rápido, aumentando -a e depois executando o img2Img em pedaços menores da imagem upscal e misturando os resultados de volta à imagem original.