很棒的稳定扩散
这是稳定扩散AI模型的软件和资源列表。
- 标记需要在GitHub外部进行第三方服务的注册或创建帐户的内容。
- ❓标志着没有明确许可条件的内容(例如,在GitHub上缺少许可证)
- ?标记非免费内容:可能需要任何付款的商业内容。
由于该主题的快速移动性质,可以以加快速度删除列表中的条目,直到生态系统成熟为止。
参见贡献。
tl; dr
对于大多数人来说,最简单的入门方法是根据所需的平台选择一个可用的GUI,并遵循其安装说明。
另外,大多数较发达的叉子(例如Invokeai)都带有自己的用户界面。
为了启动并运行,通常需要:
- 在受支持平台上的基于GUI或CLI的安装(通常是NVIDIA GPU,但对Apple Silicon,AMD GPU甚至CPU的支持都存在于某些分支中)
- 从HuggingFace下载的模型的权重(.ckpt文件)
- 系统上有足够的RAM/VRAM。
官方资源
- 稳定扩散2.1发行说明 - 稳定扩散2.1发行说明。
- https://github.com/stability-ai/stablediffusion-官方稳定性AI稳定扩散2.1版本。
- Compvis/稳定扩散 - 稳定扩散的正式发布,包括CLI,基于AI的安全分类器,可检测和抑制性内容,以及所有必要的文件以进行运行。
- 稳定性-AI/稳定性-SDK-用于构建与SteStieAi云平台集成的Python应用程序的官方SDK,而不是本地托管该模型。操作需要一个API键(?)。
- 公开发布公告 - StematieAi关于公开发布稳定扩散的公告。
- 官方不和谐 - 稳定的官方稳定扩散不和谐。
- Laion -Asesthetic-数据集使用的列车稳定扩散,可用于查询是否表示概念。
积极维护叉子和容器
此处列出的所有叉子都添加其他功能和优化,并且通常比原始版本更快,因为它们将模型保存在内存中,而不是在每个提示后重新加载它。大多数叉子似乎都会删除安全分类器,如果用于提供公共面向公共服务的服务,例如Discord机器人,可能会带来风险。目前,两个最受欢迎的叉子是自动1111和Invokeai
ABDBARHO/稳定 - 扩散 - Webui-docker- SD的轻松Docker设置,具有多个用户友好的UI选项,包括自动型1111/稳定 - 散至 - webui,sd-webui/stable-webui/stable-diffusion-diffusion-webui,webui和invoke-ai/invokeai/invokeai。
自动1111/稳定 - 扩散 - webui-目前最快,最快的分支。基于Gradio的UI具有广泛的功能,例如在和高位,预览,XY图,升级,剪贴画,文本倒置,负面提示,各种高尺度功能,培训,检查点合并和切换功能等。随附一个方便的安装脚本,可以照顾大多数依赖项和插件。
basujindal/稳定扩散 - “优化的稳定扩散” - 通过模型拆分大大降低了VRAM需求的叉子,从而在低端图形卡上稳定扩散;包括Gradio Web界面和对加权提示的支持。
bes -dev/stable_diffusion.openvino-用于使用与OpenVino兼容的CPU运行模型的叉子。
DreamArtist-只有一个训练图像,DreamArtist就可以学习其中的内容和样式,从而产生具有高可控性的各种高质量图像。 DreamArtist的嵌入可以轻松与其他描述以及两个学习的嵌入结合在一起。 (独立版本)
快速扩散 - 以Dreambooth整合为集中的速度叉子。
高斯 - 本机MacOS稳定扩散应用程序。
想象力 - 稳定扩散图像的Pythonic生成。唯一的,它支持复杂的基于文本的掩蔽。具有交互式CLI,升级,增强式,平铺和其他标准功能。没有gui。
Invoke -ai/Invokeai-(以前称为LSTEIN/稳定扩散) - 非常活跃的叉子,添加了对话cli,基本的Web界面和对GFPGAN,ESRGAN,CODERGAN,CODERFORMER,加权提示,加权提示,混合提示,负提示,负提示,IMG2IMG,瓷砖,瓷砖,文本呈现以及对Apple M1的推断。
Kerascv stablediffusion-稳定扩散在Kerascv上的高性能实施。
nicklucche/稳定 - 扩散 - nvidia-docker-多(NVIDIA)GPU能力的SD设置
复制/COPG稳定扩散 - SD V1.4的COG机器学习容器。
稳定的扩散 - jupyterlab-docker-码头设置准备使用jupyter笔记本电脑进行稳定扩散。
RunwayMl/稳定扩散 - 跑道稳定的扩散分支,具有经过特殊训练的高质量涂层培养模型。
潜在的陈旧/不太活跃的分支
这些分支机构尚未在一个多月份中进行更新,并保留在这里出于历史目的
- Neonsecret/稳定扩散 - 叉子专注于以速度为代价的较大VRAM的较大分辨率,自动调整了GPU的能力。还包括通过CodeFormer和Custom UI进行的升级,面部修复
检查点和权重
检查点(.ckpt文件)必须单独下载,并且需要运行稳定的扩散。最新的稳定性AI版本为2.1。包含NSFW概念的最后一个模型是RunwayMl发布的1.5。
对于2.x版本,有一个768x768px分辨率的模型,该模型训练了基本模型(512x512像素)。您需要其中一种模型来使用稳定的扩散,并且通常希望选择适合您需求的最新模型。
- SD -2.1型号卡(768x768px) - 稳定扩散2.1的型号卡/权重(扩散,升级和填充检查点)
- SD-2.1基本型号卡(512PX512PX) - 稳定扩散2.1的型号/权重(扩散,升级和内化检查点)
- SD -2.0型号卡 - 稳定扩散2.0的型号卡/权重(扩散,升级和介入检查点)
- RunwayMl的SD-V1-5-稳定扩散1.5检查点由RunwayMl发布。
- 官方型号卡1.5-官方稳定性AI模型卡,以拥抱所有版本的型号。下载需要登录并接受服务条款。
- 稳定 - 扩散-V-1-4-Original.CHKPT-原始1.4型号的卡片
- RealEsrgan型号 - 下载使用许多叉子实现的高尺度功能所需的最新Realesrgan模型的位置。现实和动漫内容存在不同的模型。请参阅叉文档以识别您的文件
- SD-V1-5从RunwayML侵蚀 - 通过RunwayMl发布的SD 1.5上的检查点优化。
在线演示和笔记本
- 拥抱面/SteStieAi-拥抱面空间的官方演示。
- ?官方COLAB-官方优化的COLAB,用于在Google Cloud上运行SD。由于VRAM要求,需要Colab Pro创建图像。
- Andreasjansson/稳定 - 扩散 - 动画 - 提示之间动画。
- DEFORUM-使用2D,3D,视频输入和插值动画的稳定扩散的高级笔记本。包括钻头,提示批处理等等。
- 稳定的扩散插值 - AA的简单实现n插值图像(COLAB)
- huggingface/diffuse -the -test-其余部分 - img2img从简单的草图或上传的图像中。
互补模型和工具
与稳定扩散一起使用的工具和模型
- Civitai模型存储库 - 自定义模型和文本反转嵌入的存储库。
- 提示提示 - 非正式实施交叉注意控制以提示图像编辑。
- SD-Prompt-Graph-这是一种基于React的曲线编辑器GUI,用于迅速使用稳定扩散制成的插值动画。
- DAAM-扩散注意归因图,生成热图建模特定项和令牌对最终扩散结果的影响。
- SD-Concepts-library-用户创建的文本插入嵌入的库,以在稳定扩散添加新概念
训练
Dreambooth稳定的扩散 - 实施Google的Dreambooth稳定扩散,允许对特定概念的模型进行微调。
Lora-Lora(低级适应),用于更快的文本对图像扩散微调(UNET+剪辑),这是一种比Dreambooth更快,更有效的微调方法,更快,更有效的微调方法。拥抱表演在这里。
稳定的调谐器 - 稳定的调谐器,易于安装的Dreambooth Trainer具有非常舒适的用户界面。
稳定的扩散教练 - 具有可扩展数据集大小和硬件使用情况的稳定扩散培训师。需要10克VRAM。
文本中 - 添加个性化内容以稳定扩散而无需再培训模型(Paper,Paper2)。
稳定的DreamFusion-基于稳定扩散的3D DreamFusion实现文本。
吉斯
除非其文档中另有说明,否则这些GUI中的大多数包括稳定的扩散。
?自动SD工作流程 - LSTEIN/稳定扩散的Dream.py的UI具有优化的UX,用于图像合成周围的大规模/生产工作流程。视频演练。
Carefree Creator(本地版本) - 用用户友好的GUI与创作者/以艺术家为中心的工作流程。
CMDR2/稳定 - 扩散-UI-另一个易于使用UI用于Windows和Linux。
diffusionbee-自我包含的MacOS二进制应用程序。
扩散图 - 由vue.js制成的Web UI,其灵感来自DALL -E使用扩散器,非常适合注入。视频演示
Kiri.Art(以前为SD-MUI) - 具有多种型号的移动优先PWA(包括WAIFU扩散)。在本地免费运行或在实时网站上使用免费和付费积分。用React + Mitalui构建。 (源代码) MIT License TypeScript
? NMKD GUI- Windows UI,完全有特色。封闭的来源。选择自己的价格。
SD-WEBUI/稳定 - 扩散 - Webui-非常活跃的叉子,具有可选的,具有高度功能的gradio UI并支持TXT2IMG,IMG2IMG Inpainting,GFPGAN,GFPGAN,ESRGAN,加权提示,优化的低内存版本,可选的文本发言等。
稳定的扩散污垢GUI -Windows GUI Binary for SD。封闭的来源,因此自行使用。
稳定的扩散无穷大 - 使用无限画布界面覆盖的概念证明。 (需要强大的GPU)。
不稳定的融合 - 稳定的扩散桌面前端,带有indpainting,img2img等
稳定的扩散 - webui-docker-基于码头的前端整合了最受欢迎的叉子。
综合觉 - 及时搜索引擎和发电机重新混合
升级
- Basicsr-支持多种型号的开源升级和修复工具箱。
- BSRGAN -BSRGAN-其他提高降级降解图像的升级解决方案。
- Cupscale- GUI,用于运行各种高尺度模型,包括Esrgan和Realesrgan。
- Realesrgan -Esrgan升级(2倍,4倍)和内容恢复。 Python:
pip install realesrgan - jquesnelle/txt2imghd- gobig模式的一个端口,从progrockdiffusion中提供,在TXT2IMG顶部提供了高质量的升级。
- 高档Wiki模型数据库 - 与Esrgan等人兼容检查点的Wiki和模型数据库。
内容恢复
- LAMA清洁仪 - 内容意识到AI插入工具,可用于删除图像中的不需要对象或缺陷。 Python:
pip install lama-cleaner - GFPGAN-几个叉子中包含的面部修复gan自动固定SD输出中常见的面部变形。
- CodeFormer-另一个面部修复模型(纸)。
任务链接
- Chainner-基于图形节点的编辑器,用于链接图像处理任务。
- AI-Art-generator-AI艺术套件结合了稳定的扩散和其他大型艺术生成的模型。
- DFSERVER分布式后端AI管道服务器用于构建自托管分布式GPU群集,以运行稳定的扩散和各种AI映像或及时的构建模型。
及时建筑物
提示是对扩散模型的说明来操纵其输出。
稳定的扩散提示书 - OpenAI的稳定扩散提示书,这是一种迅速工程的非常全面的资源。
ai -art.com/modifiers-关键字的视觉参考指南。
aipromptguide.com-风格,修饰符,艺术家和人员的视觉数据库
AItransformer提示构建器 - 帮助构建文本提示,使用图像到文本工具,从图像中生成详细的文本说明,以及800多个特殊的文本反转项和带有示例图像的常用通用术语。
krea.ai-提示搜索引擎,还建议您点击的提示。
- 通过创建帐户,您可以在自己的收藏中喜欢并保存提示。
Lexica.Art-图像的可搜索,可视数据库和用于创建它们的提示设置。
Pharmapsychotic/Clip -Interrogator -Jupyter Notebook使用剪贴模型建议与给定图像(演示)相似的图像提示。
短语 - 在示例数据库上绘制的视觉提示构建器。 (需要创建帐户)
PrompThero =另一个视觉提示构建器和参考库。
Promstmomia-一种视觉及时的构造工具。
ROM1504/clip -retrival-搜索用于训练稳定扩散和其他模型(在线GUI)的数据集中的及时关键字。像自动1111这样的GUIS包括此功能。
稳定的扩散提示生成器 - 提供了改进给定文本提示的建议。
提示搜索 - 另一个稳定的扩散搜索引擎,但使用公共API
相同的能量 - 可视搜索引擎,返回具有相同“能量”的图像。
PublicPrompts-公共发布的收集
专门的用户酶
- 梦文字 - 搅拌器插件利用稳定的扩散来创造纹理。
- 稳定 - 梦fusion- Google的文本到3D DreamFusion纸的开源实现,由ImageGen取代了稳定的扩散。
教程和比较
教程和高质量的教育资源
起床并运行
- 稳定的扩散方法 - 关于稳定扩散启动和运行的基本教程。
- 在Windows上安装 - 在Windows上安装和运行稳定扩散的指南。
- 在M1 Apple Silicon -Reddit线程上运行,并带有有关在Apple M1 CPU和GPU上运行稳定扩散的说明。
- 简单的仅CPU稳定扩散 - 为GNU/Linux设置仅CPU稳定扩散而无需用依赖项乱扔系统的指南。
- “ Ultimate GUI延迟指南” - 安装SD -Webui叉的教程。
学习和掌握
- 稳定的扩散Akashic记录 - 全面的指南,研究,关键字,提示和艺术家的列表。
- Sunny的技巧和技巧 - Sunny的SD Tips&Tripts Google Doc提供了许多视觉比较和有用的信息。
- AI图像生成器比较 - Petapixel.com的DALL -E,稳定扩散和Midjourney之间的视觉比较。
- 在稳定扩散中获得出色的结果 - 生成不吮吸的图像的指南。
- 图解的稳定扩散 - 稳定扩散的工作方式的插图引物。
- 编码人员的实践深度学习 - Fast.AI的高质量课程针对编码人员,涵盖了深度学习的许多方面,包括稳定的扩散。
- 顶级SD艺术家 - 可搜索的艺术家列表,稳定扩散与示例图像所知。
研究
- 修饰符研究 - 流行修饰符/关键字的视觉研究。
- 艺术家研究 - 各种艺术家的视觉研究。
扩展功能
- 构建SD Discord机器人 - 使用Python构建稳定的扩散不和谐机器人的教程。
社区资源
- 1周稳定扩散 - 稳定的扩散服务,改编,用户界面和集成的策划列表。
- Pharmapsychotic.com/tools- AI艺术的工具和资源的策划清单,包括但不限于稳定的扩散。
- 稳定的扩散资源 - 一种详尽的资源,用于回答有关稳定扩散的紧迫问题,包括指南,教程和最佳软件。
社交媒体
- R/stablediffusion-稳定的扩散子reddit。 (半官方)
- R/SDFORALL -SDFORALL
- 扩散脉冲 - 每周稳定扩散通讯
第三方应用程序的插件
- Blender插件 - 免费3D建模软件搅拌器的插件
- GIMP插件 - GIMP插件。
- Krita插件-Krita和Gimp SD插件
- Krita 5.0插件 - 基于流行的自动1111叉的另一个Krita插件。
- Photoshop插件-SD用于Photoshop(Adobe Exchange)
商业SaaS和应用程序实施稳定扩散
- ? AI Art Generator(IOS) - 使用稳定扩散生成艺术的iOS应用程序。
- aiimageGenerator.org-免费的在线艺术生成器,用于使用稳定扩散生成图像。支持TXT2IMG和IMG2IMG的生成和涂料。
- Aitransformer-免费的在线图像/视频转换工具,包括基于稳定扩散的超级打架器,支持TXT2IMG,IMG2IMG和IMG2TXT(剪辑式INTERROGATOR)。
- ? Barium.AI-从文本产生PBR(基于物理的渲染)纹理。免费和付费计划。
- ? CANVA文本到图像 - canva的文本对图像(beta)服务
- ? Dream Studio-稳定扩散的创建者SteStieAi的在线艺术一代服务。与Dall-E或Midjourney这样的服务类似,它以一种信用模型运行,并每月免费签约用户的信用津贴。
- ? Dream.ai- Wombo.ai的在线艺术一代服务(可用移动应用程序)。
- ? Gimmeapis-第三方REST API稳定扩散服务。
- ?图像计算机 - 针对非技术人员的易于使用的服务(带有免费试验学分)
- ? Neural.Love-截至2022年10月,另一个在线艺术生成器,具有宽敞的免费信用。
- ? replicate.com稳定扩散 - 另一种用于稳定扩散的SaaS产品。
- ?星空AI(iOS) - 另一项iOS应用程序,可提供预设艺术风格稳定的扩散。
- 稳定的部落 - 分布式稳定的扩散群集(想想折叠@home),使用网络,不和谐和电报接口,其中与您的GPU连接可以使您优先。
- ?稳定的扩散作为API-第三方将API纳入表扩散服务。
阁楼 - 以前的链接,因不活动而退休
- LowFuel/Progrock稳定 - 带有可选Web GUI的叉子和另一种升级方法(Gobig/Esrgan)
- TXT2IMGHD-前叉扩散的叉子,通过先从提示中生成图像,对其进行升级,然后在较小的高尺度图像上运行IMG2IMG,从而创建详细的高分辨率图像,然后将结果融合到原始图像中。