很棒的穩定擴散
這是穩定擴散AI模型的軟件和資源列表。
- 標記需要在GitHub外部進行第三方服務的註冊或創建帳戶的內容。
- ❓標誌著沒有明確許可條件的內容(例如,在GitHub上缺少許可證)
- ?標記非免費內容:可能需要任何付款的商業內容。
由於該主題的快速移動性質,可以以加快速度刪除列表中的條目,直到生態系統成熟為止。
參見貢獻。
tl; dr
對於大多數人來說,最簡單的入門方法是根據所需的平台選擇一個可用的GUI,並遵循其安裝說明。
另外,大多數較發達的叉子(例如Invokeai)都帶有自己的用戶界面。
為了啟動並運行,通常需要:
- 在受支持平台上的基於GUI或CLI的安裝(通常是NVIDIA GPU,但對Apple Silicon,AMD GPU甚至CPU的支持都存在於某些分支中)
- 從HuggingFace下載的模型的權重(.ckpt文件)
- 系統上有足夠的RAM/VRAM。
官方資源
- 穩定擴散2.1發行說明 - 穩定擴散2.1發行說明。
- https://github.com/stability-ai/stablediffusion-官方穩定性AI穩定擴散2.1版本。
- Compvis/穩定擴散 - 穩定擴散的正式發布,包括CLI,基於AI的安全分類器,可檢測和抑制性內容,以及所有必要的文件以進行運行。
- 穩定性-AI/穩定性-SDK-用於構建與SteStieAi雲平台集成的Python應用程序的官方SDK,而不是本地託管該模型。操作需要一個API鍵(?)。
- 公開發佈公告 - StematieAi關於公開發布穩定擴散的公告。
- 官方不和諧 - 穩定的官方穩定擴散不和諧。
- Laion -Asesthetic-數據集使用的列車穩定擴散,可用於查詢是否表示概念。
積極維護叉子和容器
此處列出的所有叉子都添加其他功能和優化,並且通常比原始版本更快,因為它們將模型保存在內存中,而不是在每個提示後重新加載它。大多數叉子似乎都會刪除安全分類器,如果用於提供公共面向公共服務的服務,例如Discord機器人,可能會帶來風險。目前,兩個最受歡迎的叉子是自動1111和Invokeai
ABDBARHO/穩定- 擴散- Webui-docker- SD的輕鬆Docker設置,具有多個用戶友好的UI選項,包括自動型1111/穩定- 散至- webui,sd-webui/stable-webui/stable-diffusion-diffusion -webui,webui和invoke-ai/invokeai/invokeai。
自動1111/穩定 - 擴散 - webui-目前最快,最快的分支。基於Gradio的UI具有廣泛的功能,例如在和高位,預覽,XY圖,升級,剪貼畫,文本倒置,負面提示,各種高尺度功能,培訓,檢查點合併和切換功能等。隨附一個方便的安裝腳本,可以照顧大多數依賴項和插件。
basujindal/穩定擴散 - “優化的穩定擴散” - 通過模型拆分大大降低了VRAM需求的叉子,從而在低端圖形卡上穩定擴散;包括Gradio Web界面和對加權提示的支持。
bes -dev/stable_diffusion.openvino-用於使用與OpenVino兼容的CPU運行模型的叉子。
DreamArtist-只有一個訓練圖像,DreamArtist就可以學習其中的內容和样式,從而產生具有高可控性的各種高質量圖像。 DreamArtist的嵌入可以輕鬆與其他描述以及兩個學習的嵌入結合在一起。 (獨立版本)
快速擴散 - 以Dreambooth整合為集中的速度叉子。
高斯 - 本機MacOS穩定擴散應用程序。
想像力 - 穩定擴散圖像的Pythonic生成。唯一的,它支持複雜的基於文本的掩蔽。具有交互式CLI,升級,增強式,平鋪和其他標準功能。沒有gui。
Invoke -ai/Invokeai-(以前稱為LSTEIN/穩定擴散) - 非常活躍的叉子,添加了對話cli,基本的Web界面和對GFPGAN,ESRGAN,CODERGAN,CODERFORMER,加權提示,加權提示,混合提示,負提示,負提示,IMG2IMG,瓷磚,瓷磚,文本呈現以及對Apple M1的推斷。
Kerascv stablediffusion-穩定擴散在Kerascv上的高性能實施。
nicklucche/穩定 - 擴散 - nvidia-docker-多(NVIDIA)GPU能力的SD設置
複製/COPG穩定擴散 - SD V1.4的COG機器學習容器。
穩定的擴散 - jupyterlab-docker-碼頭設置準備使用jupyter筆記本電腦進行穩定擴散。
RunwayMl/穩定擴散 - 跑道穩定的擴散分支,具有經過特殊訓練的高質量塗層培養模型。
潛在的陳舊/不太活躍的分支
這些分支機構尚未在一個多月份中進行更新,並保留在這裡出於歷史目的
- Neonsecret/穩定擴散 - 叉子專注於以速度為代價的較大VRAM的較大分辨率,自動調整了GPU的能力。還包括通過CodeFormer和Custom UI進行的升級,面部修復
檢查點和權重
檢查點(.ckpt文件)必須單獨下載,並且需要運行穩定的擴散。最新的穩定性AI版本為2.1。包含NSFW概念的最後一個模型是RunwayMl發布的1.5。
對於2.x版本,有一個768x768px分辨率的模型,該模型訓練了基本模型(512x512像素)。您需要其中一種模型來使用穩定的擴散,並且通常希望選擇適合您需求的最新模型。
- SD -2.1型號卡(768x768px) - 穩定擴散2.1的型號卡/權重(擴散,升級和填充檢查點)
- SD-2.1基本型號卡(512PX512PX) - 穩定擴散2.1的型號/權重(擴散,升級和內化檢查點)
- SD -2.0型號卡 - 穩定擴散2.0的型號卡/權重(擴散,升級和介入檢查點)
- RunwayMl的SD-V1-5-穩定擴散1.5檢查點由RunwayMl發布。
- 官方型號卡1.5-官方穩定性AI模型卡,以擁抱所有版本的型號。下載需要登錄並接受服務條款。
- 穩定 - 擴散-V-1-4-Original.CHKPT-原始1.4型號的卡片
- RealEsrgan型號 - 下載使用許多叉子實現的高尺度功能所需的最新Realesrgan模型的位置。現實和動漫內容存在不同的模型。請參閱叉文檔以識別您的文件
- SD-V1-5從RunwayML侵蝕 - 通過RunwayMl發布的SD 1.5上的檢查點優化。
在線演示和筆記本
- 擁抱面/SteStieAi-擁抱面空間的官方演示。
- ?官方COLAB-官方優化的COLAB,用於在Google Cloud上運行SD。由於VRAM要求,需要Colab Pro創建圖像。
- Andreasjansson/穩定 - 擴散 - 動畫 - 提示之間動畫。
- DEFORUM-使用2D,3D,視頻輸入和插值動畫的穩定擴散的高級筆記本。包括鑽頭,提示批處理等等。
- 穩定的擴散插值 - AA的簡單實現n插值圖像(COLAB)
- huggingface/diffuse -the -test-其餘部分 - img2img從簡單的草圖或上傳的圖像中。
互補模型和工具
與穩定擴散一起使用的工具和模型
- Civitai模型存儲庫 - 自定義模型和文本反轉嵌入的存儲庫。
- 提示提示 - 非正式實施交叉注意控制以提示圖像編輯。
- SD-Prompt-Graph-這是一種基於React的曲線編輯器GUI,用於迅速使用穩定擴散製成的插值動畫。
- DAAM-擴散注意歸因圖,生成熱圖建模特定項和令牌對最終擴散結果的影響。
- SD-Concepts-library-用戶創建的文本插入嵌入的庫,以在穩定擴散添加新概念
訓練
Dreambooth穩定的擴散 - 實施Google的Dreambooth穩定擴散,允許對特定概念的模型進行微調。
Lora-Lora(低級適應),用於更快的文本對圖像擴散微調(UNET+剪輯),這是一種比Dreambooth更快,更有效的微調方法,更快,更有效的微調方法。擁抱表演在這裡。
穩定的調諧器 - 穩定的調諧器,易於安裝的Dreambooth Trainer具有非常舒適的用戶界面。
穩定的擴散教練 - 具有可擴展數據集大小和硬件使用情況的穩定擴散培訓師。需要10克VRAM。
文本中 - 添加個性化內容以穩定擴散而無需再培訓模型(Paper,Paper2)。
穩定的DreamFusion-基於穩定擴散的3D DreamFusion實現文本。
吉斯
除非其文檔中另有說明,否則這些GUI中的大多數包括穩定的擴散。
?自動SD工作流程 - LSTEIN/穩定擴散的Dream.py的UI具有優化的UX,用於圖像合成周圍的大規模/生產工作流程。視頻演練。
Carefree Creator(本地版本) - 用用戶友好的GUI與創作者/以藝術家為中心的工作流程。
CMDR2/穩定 - 擴散-UI-另一個易於使用UI用於Windows和Linux。
diffusionbee-自我包含的MacOS二進制應用程序。
擴散圖 - 由vue.js製成的Web UI,其靈感來自DALL -E使用擴散器,非常適合注入。視頻演示
Kiri.Art(以前為SD-MUI) - 具有多種型號的移動優先PWA(包括WAIFU擴散)。在本地免費運行或在實時網站上使用免費和付費積分。用React + Mitalui構建。 (源代碼) MIT License TypeScript
? NMKD GUI- Windows UI,完全有特色。封閉的來源。選擇自己的價格。
SD-WEBUI/穩定- 擴散- Webui-非常活躍的叉子,具有可選的,具有高度功能的gradio UI並支持TXT2IMG,IMG2IMG Inpainting,GFPGAN,GFPGAN,ESRGAN,加權提示,優化的低內存版本,可選的文本發言等。
穩定的擴散污垢GUI -Windows GUI Binary for SD。封閉的來源,因此自行使用。
穩定的擴散無窮大 - 使用無限畫布界面覆蓋的概念證明。 (需要強大的GPU)。
不穩定的融合 - 穩定的擴散桌面前端,帶有indpainting,img2img等
穩定的擴散 - webui-docker-基於碼頭的前端整合了最受歡迎的叉子。
綜合覺 - 及時搜索引擎和發電機重新混合
升級
- Basicsr-支持多種型號的開源升級和修復工具箱。
- BSRGAN -BSRGAN-其他提高降級降解圖像的升級解決方案。
- Cupscale- GUI,用於運行各種高尺度模型,包括Esrgan和Realesrgan。
- Realesrgan -Esrgan升級(2倍,4倍)和內容恢復。 Python:
pip install realesrgan - jquesnelle/txt2imghd- gobig模式的一個端口,從progrockdiffusion中提供,在TXT2IMG頂部提供了高質量的升級。
- 高檔Wiki模型數據庫 - 與Esrgan等人兼容檢查點的Wiki和模型數據庫。
內容恢復
- LAMA清潔儀 - 內容意識到AI插入工具,可用於刪除圖像中的不需要對像或缺陷。 Python:
pip install lama-cleaner - GFPGAN-幾個叉子中包含的面部修復gan自動固定SD輸出中常見的面部變形。
- CodeFormer-另一個面部修復模型(紙)。
任務鏈接
- Chainner-基於圖形節點的編輯器,用於鏈接圖像處理任務。
- AI-Art-generator-AI藝術套件結合了穩定的擴散和其他大型藝術生成的模型。
- DFSERVER分佈式後端AI管道服務器用於構建自託管分佈式GPU群集,以運行穩定的擴散和各種AI映像或及時的構建模型。
及時建築物
提示是對擴散模型的說明來操縱其輸出。
穩定的擴散提示書 - OpenAI的穩定擴散提示書,這是一種迅速工程的非常全面的資源。
ai -art.com/modifiers-關鍵字的視覺參考指南。
aipromptguide.com-風格,修飾符,藝術家和人員的視覺數據庫
AItransformer提示構建器 - 幫助構建文本提示,使用圖像到文本工具,從圖像中生成詳細的文本說明,以及800多個特殊的文本反轉項和帶有示例圖像的常用通用術語。
krea.ai-提示搜索引擎,還建議您點擊的提示。
- 通過創建帳戶,您可以在自己的收藏中喜歡並保存提示。
Lexica.Art-圖像的可搜索,可視數據庫和用於創建它們的提示設置。
Pharmapsychotic/Clip -Interrogator -Jupyter Notebook使用剪貼模型建議與給定圖像(演示)相似的圖像提示。
短語 - 在示例數據庫上繪製的視覺提示構建器。 (需要創建帳戶)
PrompThero =另一個視覺提示構建器和參考庫。
Promstmomia-一種視覺及時的構造工具。
ROM1504/clip -retrival-搜索用於訓練穩定擴散和其他模型(在線GUI)的數據集中的及時關鍵字。像自動1111這樣的GUIS包括此功能。
穩定的擴散提示生成器 - 提供了改進給定文本提示的建議。
提示搜索 - 另一個穩定的擴散搜索引擎,但使用公共API
相同的能量 - 可視搜索引擎,返回具有相同“能量”的圖像。
PublicPrompts-公共發布的收集
專門的用戶酶
- 夢文字 - 攪拌器插件利用穩定的擴散來創造紋理。
- 穩定 - 夢fusion- Google的文本到3D DreamFusion紙的開源實現,由ImageGen取代了穩定的擴散。
教程和比較
教程和高質量的教育資源
起床並運行
- 穩定的擴散方法 - 關於穩定擴散啟動和運行的基本教程。
- 在Windows上安裝 - 在Windows上安裝和運行穩定擴散的指南。
- 在M1 Apple Silicon -Reddit線程上運行,並帶有有關在Apple M1 CPU和GPU上運行穩定擴散的說明。
- 簡單的僅CPU穩定擴散 - 為GNU/Linux設置僅CPU穩定擴散而無需用依賴項亂扔系統的指南。
- “ Ultimate GUI延遲指南” - 安裝SD -Webui叉的教程。
學習和掌握
- 穩定的擴散Akashic記錄 - 全面的指南,研究,關鍵字,提示和藝術家的列表。
- Sunny的技巧和技巧 - Sunny的SD Tips&Tripts Google Doc提供了許多視覺比較和有用的信息。
- AI圖像生成器比較 - Petapixel.com的DALL -E,穩定擴散和Midjourney之間的視覺比較。
- 在穩定擴散中獲得出色的結果 - 生成不吮吸的圖像的指南。
- 圖解的穩定擴散 - 穩定擴散的工作方式的插圖引物。
- 編碼人員的實踐深度學習 - Fast.AI的高質量課程針對編碼人員,涵蓋了深度學習的許多方面,包括穩定的擴散。
- 頂級SD藝術家 - 可搜索的藝術家列表,穩定擴散與示例圖像所知。
研究
- 修飾符研究 - 流行修飾符/關鍵字的視覺研究。
- 藝術家研究 - 各種藝術家的視覺研究。
擴展功能
- 構建SD Discord機器人 - 使用Python構建穩定的擴散不和諧機器人的教程。
社區資源
- 1週穩定擴散 - 穩定的擴散服務,改編,用戶界面和集成的策劃列表。
- Pharmapsychotic.com/tools- AI藝術的工具和資源的策劃清單,包括但不限於穩定的擴散。
- 穩定的擴散資源 - 一種詳盡的資源,用於回答有關穩定擴散的緊迫問題,包括指南,教程和最佳軟件。
社交媒體
- R/stablediffusion-穩定的擴散子reddit。 (半官方)
- R/SDFORALL -SDFORALL
- 擴散脈衝 - 每週穩定擴散通訊
第三方應用程序的插件
- Blender插件 - 免費3D建模軟件攪拌器的插件
- GIMP插件 - GIMP插件。
- Krita插件-Krita和Gimp SD插件
- Krita 5.0插件 - 基於流行的自動1111叉的另一個Krita插件。
- Photoshop插件-SD用於Photoshop(Adobe Exchange)
商業SaaS和應用程序實施穩定擴散
- ? AI Art Generator(IOS) - 使用穩定擴散生成藝術的iOS應用程序。
- aiimageGenerator.org-免費的在線藝術生成器,用於使用穩定擴散生成圖像。支持TXT2IMG和IMG2IMG的生成和塗料。
- Aitransformer-免費的在線圖像/視頻轉換工具,包括基於穩定擴散的超級打架器,支持TXT2IMG,IMG2IMG和IMG2TXT(剪輯式INTERROGATOR)。
- ? Barium.AI-從文本產生PBR(基於物理的渲染)紋理。免費和付費計劃。
- ? CANVA文本到圖像 - canva的文本對圖像(beta)服務
- ? Dream Studio-穩定擴散的創建者SteStieAi的在線藝術一代服務。與Dall-E或Midjourney這樣的服務類似,它以一種信用模型運行,並每月免費簽約用戶的信用津貼。
- ? Dream.ai- Wombo.ai的在線藝術一代服務(可用移動應用程序)。
- ? Gimmeapis-第三方REST API穩定擴散服務。
- ?圖像計算機 - 針對非技術人員的易於使用的服務(帶有免費試驗學分)
- ? Neural.Love-截至2022年10月,另一個在線藝術生成器,具有寬敞的免費信用。
- ? replicate.com穩定擴散 - 另一種用於穩定擴散的SaaS產品。
- ?星空AI(iOS) - 另一項iOS應用程序,可提供預設藝術風格穩定的擴散。
- 穩定的部落 - 分佈式穩定的擴散群集(想想折疊@home),使用網絡,不和諧和電報接口,其中與您的GPU連接可以使您優先。
- ?穩定的擴散作為API-第三方將API納入表擴散服務。
閣樓 - 以前的鏈接,因不活動而退休
- LowFuel/Progrock穩定 - 帶有可選Web GUI的叉子和另一種升級方法(Gobig/Esrgan)
- TXT2IMGHD-前叉擴散的叉子,通過先從提示中生成圖像,對其進行升級,然後在較小的高尺度圖像上運行IMG2IMG,從而創建詳細的高分辨率圖像,然後將結果融合到原始圖像中。