Потрясающая стабильная диффузия
Это список программного обеспечения и ресурсов для модели AI стабильной диффузии.
- Оценка содержимого, которое требует регистрации или создания учетной записи для сторонней службы за пределами GitHub.
- ❓ Оценка содержимого с неясными условиями лицензирования (например, отсутствие лицензии на GitHub)
- ? Оценки не бесплатного контента: коммерческий контент, который может потребовать какого-либо платежа.
Из-за быстро движущегося характера темы записи в списке могут быть удалены с ускоренной скоростью, пока экосистема не созревает.
Смотрите.
TL; DR
Самый простой способ начать для большинства людей - выбрать один из доступных графических интерфейсов на основе желаемой платформы и следовать его инструкциям по установке.
В качестве альтернативы, большинство более разработанных вилок (например, Invokeai) поставляются с собственными пользовательскими интерфейсами.
Чтобы встать и работать, обычно нужно:
- Установка на основе графического интерфейса или CLI на поддерживаемой платформе (обычно NVIDIA GPU, но в некоторых филиалах существует поддержка Apple Silicon, AMD -графических процессоров и даже процессора).
- Веса (.
- Достаточный ОЗУ/Врам, доступный в системе.
Официальные ресурсы
- Стабильная диффузия 2.1 Примечания выпуска - Стабильная диффузия 2.1 Примечания выпуска.
- https://github.com/stability-ai/stablediffusion - официальная стабильная стабильная диффузия 2.1.
- Compvis/стабильная диффузия - официальное выпуск стабильной диффузии, включая CLI, классификатор безопасности на основе искусственного интеллекта, который обнаруживает и подавляет сексуализированный контент, и все необходимые файлы для работы.
- Stabibality-AI/Stability-SDK-Официальный SDK, используемый для создания приложений Python, интегрированных с облачной платформой Stabilityai, а не для размещения модели локально. Операция требует ключа API (?).
- Общественное объявление о выпуске - объявление Stabilyai о публичном выпуске стабильной диффузии.
- Официальный раздор - официальный стабильный диффузионный раздор по стабильности.
- LAION -AESTETIC - набор данных использовал стабильную диффузию поезда, полезную для запроса, чтобы увидеть, представлена ли концепция.
Активно поддерживаемые вилки и контейнеры
Все вилки, перечисленные здесь, добавляют дополнительные функции и оптимизации и, как правило, быстрее, чем оригинальный выпуск, поскольку они держат модель в памяти, а не перезагружая ее после каждой подсказки. Большинство вилок, по-видимому, устраняют классификатор безопасности, который может представлять риск, если он используется для предоставления общественных услуг, таких как боты для раздоров. Двумя наиболее популярными вилками на данный момент являются автоматическими1111 и Invokeai
Abdbarho/Stable-Diffusion-Webui-Docker-Easy Docker Setup для SD с несколькими удобными для пользователя вариантов пользовательского интерфейса, включая Automatic11111/Stable-Diffusion-Webui, SD-Webui/Stable-Diffusion-Webui и Invoke-AI/Invokeai.
Automatic1111/стабильная диффузия-Webui-Вероятно, самый быстрый движущийся, большинство в настоящее время имеют богатую ветвь. Пользовательский интерфейс на основе GRADIO с обширными функциями, такими как внедорожник и озамировка, предварительные просмотры, графики XY, масштабирование, интеррогация клипа, текстовая инверсия, негативная подсказка, различные функции масштабирования, тренировки, слияние контрольной точки и многое другое. Поставляется с удобным сценарием установки, который заботится о большинстве зависимостей и дополнений.
Basujindal/стабильная диффузия-«оптимизированная стабильная диффузия»-вилка с резко сниженными требованиями VRAM посредством разделения модели, обеспечивая стабильную диффузию на графических картах нижних классов; Включает в себя веб -интерфейс Gradio и поддержку взвешенных подсказок.
bes -dev/stable_diffusion.openvino - вилка для запуска модели с использованием ЦП, совместимого с OpenVino.
Dreamartist - только с одним тренировочным изображением Dreamartist изучает контент и стиль в нем, генерируя разнообразные высококачественные изображения с высокой управляемостью. Внедрения Dreamartist можно легко сочетать с дополнительными описаниями, а также с двумя изученными вставками. (автономная версия)
Быстрый стабильный диффузия-Форк, ориентированная на скорость, с интеграцией Dreambooth.
Gauss - Приложение для стабильного диффузии MacOS.
Imaginairy - Pythonic Generation стабильных диффузионных изображений. Уникальный в том, что поддерживает сложную текстовую маскировку. Имеет интерактивный CLI, расширение, улучшение лица, плитка и другие стандартные функции. Нет графического интерфейса.
Invoke -AI/Invokeai - (ранее известный как LSTEIN/Stable -Diffusion) - очень активная вилка, добавляя разговорную клиенту, базовый веб -интерфейс и поддержку GFPGAN, ESRGAN, CODEMFormer, взвешенные подсказки, быстрое смешение, отрицательное подсказка, IMG2IMG, Tiling, текстовое инверсию, а также вывод на Apple M1.
KERASCV Stablabliffusion - Высокая эффективность реализации стабильной диффузии на Kerascv.
Nicklucche/Stable-Diffusion-Nvidia-Docker-Multi (Nvidia) GPU, способный настройка Docker SD
Replicate/Copg-Stable-Diffusion-контейнер для машинного обучения COG SD V1.4.
Стабильная диффузия-Юпитерлаб-Докер-настройка Docker, готовая к ноутбукам Jupyter для стабильной диффузии.
Runwayml/Stable -Diffusion - Стабильная диффузионная ветвь по Runwayml с специально обученной моделью внедорожника для высококачественного входа.
Потенциально несвежие/менее активные ветви
Эти филиалы не были обновлены более чем через месяцы и хранятся здесь для исторических целей
- Нерецептура/стабильная диффузия - Форк, фокусируясь на более крупных разрешениях с меньшим количеством VRAM за счет скорости, автоматически регулируя способности графических процессоров. Также включает в себя масштаб, восстановление лица через CodeFormer и пользовательский пользовательский интерфейс
Контрольные точки и веса
Контрольные точки (файлы. Последний релиз AI Stability составляет 2.1. Последняя модель, содержащая концепции NSFW, была 1,5, выпущенная Runwayml.
Для выпусков 2.x существует модель разрешения 768x768px, обученная базовой модели (512x512 пикселей). Вам нужна одна из этих моделей, чтобы использовать стабильную диффузию и, как правило, вы хотите выбрать последнюю, которая соответствует вашим потребностям.
- SD -2.1 модельные карты (768x768px) - модели карты/веса для стабильной диффузии 2.1 (диффузия, масштабирование и внедрение контрольных точек)
- SD-2.1 Базовые модели карты (512px512px)-модели карты/веса для стабильной диффузии 2.1 (диффузии, повышение квалификации и интразинг контрольных точек) https://huggingface.co/stability/stable-diffusion-2-1-base-base
- SD -2.0 модели карты - модели карты/веса для стабильной диффузии 2.0 (контрольные точки диффузии, повышения квалификации и внедрения)
- SD-V1-5 от Runwayml-Контрольная точка Diffusion 1.5, выпущенная Runwayml.
- Официальная модель карта 1.5 - Официальная карта модели AI стабильности для обнимающего лица со всеми версиями модели. Загрузка требует входа и принятия условий обслуживания.
- stable-diffusion-v-1-4-original.chkpt-оригинальная карта модели 1.4
- Модели Realesrgan - Место загрузки для новейших моделей Realesrgan, необходимых для использования функций повышения масштаба, реализованных многими вилками. Различные модели существуют для реалистичного и аниме -контента. Пожалуйста, обратитесь к документации по вилке, чтобы определить те, которые вы
- SD-V1-5-5-инпентирование от Runwayml-Контрольная точка оптимизирована для Inpainting на SD 1.5, выпущенная Runwayml.
Онлайн демо и ноутбуки
- Huggingface/Stabilityai - официальная демонстрация на пространствах для объятий.
- ? Offical Colab - официальный, оптимизированный Colab для запуска SD в Google Cloud. Из -за требований VRAM требовалось COLAB Pro для создания изображений.
- Андреасанссон/стабильная диффузия-анимация-оживление между подсказками.
- Deforum - Advanced Notebook для стабильной диффузии с 2D, 3D, видео ввод и анимации интерполяции. Включает в себя внедорожник, быстрое партии и многое другое.
- Стабильная диффузионная интерполяция - AA Простая реализация генерации N -интерполированных изображений (Colab)
- HuggingFace/Diffuse the -Rest - Diffuse остальные - Img2img из простых эскизов или загруженных изображений.
Дополнительные модели и инструменты
Инструменты и модели для использования в сочетании со стабильной диффузией
- Репозиторий модели Civitai - репозиторий для пользовательских моделей и текстовых инверсионных инверсий.
- Подсказка о приглашении-неофициальная реализация контроля по перекрестному взаимодействию для быстрого приглашения на предложение редактирования изображений.
- SD-Prompt-Graph-это графический интерфейс кривой на основе реагирования для быстрого интерполяционного анимации, изготовленной со стабильной диффузией.
- DAAM - Диффузионные карты атрибуции внимания, генерируя тепловые карты, моделирующие влияние конкретных терминов и токенов в приглашении на конечный результат диффузии.
- SD-Concepts-Library-библиотека пользовательских созданных текстовых инверсионных инверций, чтобы добавить новые концепции в стабильную диффузию
Обучение
Dreambooth-Stable-Diffusion-реализация Google Dreambooth для стабильной диффузии, позволяющая точно настраивать модель для конкретных концепций.
LORA-LORA (адаптация с низкой ранкой) для более высокой диффузии текста к изображению тонкой настройки (UNET+CLIP), более быстрый, более эффективный метод тонкой настройки, требующий меньше оперативной памяти, чем Dreambooth. Demo Demo здесь.
Стабильный тюнер - стабильный тюнер, прост в установке тренера Dreambooth с очень удобным пользовательским интерфейсом.
Стабильный диффузионный тренер - стабильный диффузионный тренер с масштабируемым размером набора данных и использованием аппаратного обеспечения. Требуется 10G VRAM.
Текстовая инверсия - добавление персонализированного контента к стабильной диффузии без переподготовки модели (Paper, Paper2).
Стабильный Dreamfusion - Текст на 3D Dreamfusion реализация на основе стабильной диффузии.
Гис
Большинство из этих графиков, если не упомянуто иное в их документации, включают стабильную диффузию.
? Auto SD Workflow-пользовательский интерфейс для LSTEIN/STABLE-DIFFUSION'S DREAM.PY с оптимизированным UX для крупномасштабного/производственного рабочего процесса вокруг синтеза изображения. Видео прохождение.
Carefree Creator (локальная версия) - удобный графический интерфейс с рабочим процессом, ориентированным на создателя/художника.
CMDR2/Stable-Diffusion-UI-другой, простой в использовании пользовательского интерфейса для Windows и Linux.
DiffusionBee - саморегистрированное бинарное приложение для macOS.
Diffusionui - Интернет -интерфейс, изготовленный с Vue.js, вдохновленным Dall -E с использованием диффузоров, идеально подходит для внедрения. Видео демонстрация
Kiri.art (ранее SD-Mui)-мобильный PWA с несколькими моделями (включая диффузию вайфу). Запустите бесплатно или используйте бесплатные и оплачиваемые кредиты на сайте Live. Построен с React + MaterialUI. (Исходный код) TypeScript MIT License
? NMKD GUI - Windows UI, полностью представлен. Закрытый источник. Выберите свою собственную цену.
SD-Webui/Stable-Diffusion-Webui-очень активная вилка с необязательным, очень спектакльным пользовательским интерфейсом Gradio и поддержкой TXT2IMG, IMG2IMG Inpainting, GFPGAN, ESRGA, взвешенными подсказками, оптимизированной версией низкой памяти, необязательной текстовой инверсией и многом другом.
Стабильная диффузия Grisk GUI - GUI Windows GUI для SD. Закрытый источник, поэтому используйте свой собственный риск.
Стабильная диффузионная бесконечность - доказательство концепции для озадирования с бесконечным границей холста. (требует мощного графического процессора).
Нестабильный фьюжн - стабильный фронт диффузионного рабочего стола с интразинг, IMG2IMG и многое другое
Стабильная диффузия-Webui-Docker-фронт на основе Docker, интегрирующий самые популярные вилки.
Synesthetic - оперативная поисковая система и генератор, сфокусированные на ремиксе
Выполнение
- Basicsr - Набор инструментов для масштабирования и восстановления с открытым исходным кодом, поддерживающий несколько моделей.
- BSRGAN - BSRGAN - большее масштабирование раствора, специализируемое на расширенных изображениях.
- CupScale - GUI для запуска различных моделей с масштабированием, включая Esrgan и Realesrgan.
- Realesrgan - Esrgan opscaling (2x, 4x) и восстановление контента. Python:
pip install realesrgan - jquesnelle/txt2imghd - порт режима гобига от Progrockdiffusion, обеспечивающий высококачественный масштабирование поверх txt2img.
- Повышенная база данных Wiki Model - база данных Wiki и модели для контрольных точек, совместимые с Esrgan et al.
Восстановление контента
- LAMA -CLEANER - Инструмент по внедрению ИИ, знаящий контент, полезно для удаления нежелательных объектов или дефектов из изображений. Python:
pip install lama-cleaner - GFPGAN - Восстановление лица GAN включена в несколько вилок для автоматического исправления деформации лица, обычно встречающейся на выходе SD.
- CodeFormer - Еще одна модель восстановления лица (бумага).
Цепочка задачи
- Chainner - Редактор на основе графического узла для задач обработки изображений.
- AI-Art Generator-AI Generation Generation Suite, объединяющий стабильную диффузию и другие модели для генерации искусства высокого объема.
- DFServer Распределенное бэкэнд-сервер AI Pipeline Server для создания самостоятельного распределенного кластера графических процессоров для запуска стабильной диффузии и различных изображений ИИ или модели быстрого здания.
Быстрое здание
Подсказки - это инструкции, данные диффузионным моделям для манипулирования их выводом.
Стабильная книга о приглашении на диффузию - Книга Openai's Stable Diffusion Book, очень полный ресурс по быстрой инженерии.
AI -Art.com/Modifiers - Руководство по визуальной справочнике для ключевых слов.
aipromptguide.com - Визуальная база данных стилей, модификатора, художников и людей
Aitransformer resmpt Builder - Помогите построить текстовые подсказки интуитивно, используя изображение в текстовый инструмент для создания подробных описаний текста с изображения и более 800+ специальных терминов инверсии текста и часто используемых общих терминов с образцами изображений.
KREA.AI - быстрое поисковая система, которая также рекомендует аналогичные подсказки, которые вы нажимаете.
- При создании учетной записи вы можете любить и сохранять подсказки в собственных коллекциях.
Lexica.art - доступная для поиска, визуальная база данных изображений и настройки подсказок, используемые для их создания.
Pharmapsychotic/Clip -Interrogator - Notebook Jupyter использует модели клипов, чтобы предложить подсказку для изображений, аналогичных данным изображению (демонстрация).
PHRASER - визуальный подсказка, рисующий базу данных примеров. (Требует создания учетной записи)
Prompthero = еще один визуальный строитель и справочная библиотека.
Rampomania - визуальный инструмент строительства.
ROM1504/CLIP -RETRIEVAL - Поиск для быстрых ключевых слов в наборах данных, используемых в обучении стабильной диффузии и других моделей (онлайн -графический интерфейс). Некоторые GUI, такие как Automatic1111, включают эту функциональность.
Стабильный генератор диффузии - дает предложения по улучшению данной текстовой приглашения.
Resptsearch - еще одна стабильная поисковая система диффузии, но с публичным API
Та же энергия - визуальная поисковая система, которая возвращает изображения, которые имеют одинаковую «энергию».
PublicPrompts - Сбор PublicPrompts
Специализированные пользователи
- Текстуры снов - адденс блендера, использующий стабильную диффузию для создания текстуры.
- Стабильная Dreamfusion-Реализация открытого исходного кода бумаги Google Text-3D DreamFusion с ImageGen, замененной стабильной диффузией.
Учебные пособия и сравнения
Учебные пособия и высококачественные образовательные ресурсы
Вставая и бегая
- Стабильная диффузия, как - основное руководство по получению стабильной диффузии и запуском.
- Установка на Windows - руководство по установке и пробежке стабильной диффузии в Windows.
- Запуск на Apple M
- Легкая стабильная диффузия только CPU-руководство по настройке стабильной диффузии только для ЦП для GNU/Linux без мусора системы с зависимостями.
- «Ultimate Gui Guide» - Учебное пособие по установке вилки SD -Webui.
Обучение и мастерство
- Стабильная диффузия Akashic Records - комплексный список руководств, исследований, ключевых слов, подсказок и художников.
- Советы и хитрости Sunny - Sunny's SD Tips & Tricks Google Doc с множеством визуальных сравнений и полезной информации.
- Сравнение генератора изображений ИИ - визуальное сравнение между Далл -Э, стабильной диффузией и мидюрни от Petapixel.com.
- Получение отличных результатов при стабильной диффузии - руководство по созданию изображений, которые не отстой.
- Иллюстрированная стабильная диффузия - проиллюстрированный праймер о том, как работает стабильная диффузия.
- Практическое глубокое обучение для кодировщиков - высококачественный курс Fast.ai, нацеленный на кодировщиков, которые охватывают многие аспекты глубокого обучения, включая стабильную диффузию.
- Top SD Artists - Список художников, известных стабильной диффузией с примерами изображений.
Исследования
- Исследования модификаторов - визуальное исследование популярных модификаторов/ключевых слов.
- Исследования художника - Визуальное исследование различных художников.
Расширение функциональности
- Создание SD Discord Bot - учебник по строительству стабильного бота для диффузии Discord с использованием Python.
Общественные ресурсы
- 1 неделя стабильной диффузии - курированный список стабильных диффузионных служб, адаптации, пользовательских интерфейсов и интеграций.
- Pharmapsychotic.com/tools - кураторный список инструментов и ресурсов для искусства искусственного искусства, включая, помимо прочего, стабильную диффузию.
- Стабильные диффузионные ресурсы - тщательный ресурс для ответа на насущные вопросы о стабильной диффузии, включая руководства, учебные пособия и лучшее программное обеспечение.
Социальные сети
- r/stablediffusion - стабильная диффузионная субреддит. (Полуфициальный)
- R/Sdforall - Sdforall
- Диффузионный импульс - еженедельный стабильный диффузионный информационный бюллетень
Плагины для сторонних приложений
- Плагин Blender - плагин для бесплатного программного блендера 3D -моделирования
- Gimp Plugin - Gimp Plugin.
- Плагин Krita - плагин Krita и Gimp SD
- Плагин Krita 5.0 - еще один плагин Krita, основанный на популярной вилке Automatic111111.
- Плагин Photoshop - SD для Photoshop (Adobe Exchange)
Коммерческие SaaS и приложения внедрение стабильной диффузии
- ? AI ART Generator (iOS) - приложение для iOS для генерации искусства с использованием стабильной диффузии.
- aiimagegenerator.org - Бесплатный онлайн -генератор искусств для генерации изображений с использованием стабильной диффузии. Поддерживает генерацию TXT2IMG и IMG2IMG и внедрение.
- Aitransformer - Бесплатные инструменты онлайн -изображения/трансформации видео, в том числе супер -стилизер на основе стабильной диффузии, поддерживает TXT2IMG, IMG2IMG и IMG2TXT (клип -интеррогатор).
- ? Barium.ai - генерировать текстуры PBR (рендеринг на основе физики) из текста. Бесплатные и оплачиваемые планы.
- ? Canva Text-To-Image-Служба текста до изображения (бета) от Canva
- ? Dream Studio - онлайн -сервис генерации искусств от Stabalityai, создатели стабильной диффузии. Подобно таким сервисам, как Dall-E или Midjourney, это работает на кредитной модели с бесплатным пособием кредитов, предоставленных подписанным пользователям ежемесячно.
- ? Dream.ai - онлайн -сервис генерации искусств от wombo.ai (мобильные приложения доступны).
- ? Gimmeapis - Слуедящая стабильная диффузионная служба REST REST.
- ? Изображение компьютер-простой в использовании сервис, направленный на нетехнические люди (поставляется с бесплатными пробными кредитами)
- ? Neural.love - еще один онлайн -генератор искусств с щедрыми бесплатными кредитами по состоянию на октябрь 2022 года.
- ? Replicate.com стабильная диффузия - еще одна предложение SaaS для стабильной диффузии.
- ? Starry AI (iOS) - еще одно приложение для iOS, предлагающее стабильную диффузию с предустановленными стилями искусства.
- Стабильная орда - распределенный стабильный диффузионный кластер (Think Folding@Home) с интерфейсами Web, Discord и Telegram, где соединение с вашим графическим процессором дает вам приоритет.
- ? Стабильная диффузия как API - API стороннего отдыха в службу диффузии таблицы.
Чердак - предыдущие ссылки, вышедшие на пенсию за бездействие
- Lowfuel/Sprogrock -Stable - вилка с дополнительным веб -графическим интерфейсом и другим подходом к масштабированию (Gobig/Esrgan)
- txt2imghd - вилка диффузии программирования, которая создает подробные изображения с более высоким разрешением, сначала генерируя изображение из приглашения, расширяя его, а затем запустив IMG2IMG на более мелких кусочках высококлассного изображения и смешивая результаты обратно в исходное изображение.