素晴らしい安定した拡散
これは、安定した拡散AIモデルのソフトウェアとリソースのリストです。
- GitHub外のサードパーティサービスのサインアップまたはアカウント作成が必要なコンテンツをマークします。
- compled不明なライセンス条件を持つコンテンツをマークします(たとえば、GitHubにライセンスの欠如)
- ?マークなしコンテンツ:あらゆる種類の支払いが必要な商業コンテンツ。
トピックの動きが速いため、リスト内のエントリは、生態系が成熟するまで迅速な速度で削除される場合があります。
貢献を参照してください。
tl; dr
ほとんどの人にとって開始する最も簡単な方法は、目的のプラットフォームに基づいて利用可能なGUIの1つを選択し、インストール手順に従うことです。
あるいは、より開発されたフォークのほとんど(Invokeaiなど)には、独自のユーザーインターフェイスが付属しています。
起きて実行するには、通常:
- サポートされているプラットフォームへのGUIまたはCLIベースのインストール(通常はNVIDIA GPUですが、Appleシリコン、AMD GPU、さらにはCPUのサポートがあります。
- HuggingfaceからダウンロードされたモデルのWeights(.ckptファイル)
- システムで利用可能な十分なRAM/VRAM。
公式リソース
- 安定した拡散2.1リリースノート - 安定した拡散2.1リリースノート。
- https://github.com/stability-ai/stablediffusion-公式安定性AI安定拡散2.1リリース。
- Compvis/Stable拡散 - CLI、AIベースの安全分類器を含む安定した拡散の公式リリース、性的化されたコンテンツを検出および抑制し、実行するために必要なすべてのファイルを抑制します。
- stability-ai/stability-sdk-モデルをローカルにホストする代わりに、StabilityAのクラウドプラットフォームと統合されたPythonアプリケーションを構築するために使用される公式のSDK。操作にはAPIキー(?)が必要です。
- パブリックリリースの発表 - 安定した拡散の公開に関するStableaiの発表。
- 公式の不一致 - 安定性による公式の安定した拡散不一致。
- Laion -Aesthetic -Datasetは、概念が表されるかどうかを確認するためにクエリに役立つ列車の安定した拡散を使用しました。
積極的に維持されたフォークと容器
ここにリストされているすべてのフォークは、追加の機能と最適化を追加し、一般的に元のリリースよりも高速です。これは、プロンプトのすべての後にモデルをリロードするのではなく、メモリに保持するためです。ほとんどのフォークは、Discord Botsなどの公開サービスを提供するために使用される場合、リスクをもたらす可能性のある安全分類器を除去するようです。この時点で最も人気のある2つのフォークは、自動1111とInvokeaiです
Abdbarho/Stable-Diffusion-Webui-Docker-Automatic1111/Stable-Diffusion-Webui、SD-Webui/Stable-Diffusion-Webui、Invoke-Ai/Invokeaiなど、複数のユーザーフレンドリーなUIオプションを備えたSD用の簡単なDockerセットアップ。
Automatic1111/Stable-Diffusion-Webui-おそらく最も速く、最も豊富なブランチが最も速く、最も豊富なブランチです。グラデーションベースのUIは、中規模、プレビュー、XYプロット、アップスケーリング、クリップ挿入、テキストの反転、ネガティブプロンプト、さまざまなアップスケーリング機能、トレーニング、チェックポイントの合併、スイッチング機能などなどの広範な機能を備えています。ほとんどの依存関係とアドオンを処理する便利なインストールスクリプトが付属しています。
Basujindal/Stable拡散 - 「最適化された安定した拡散」 - モデル分割によりVRAM要件を劇的に減少させたフォーク、ローエンドグラフィックスカードの安定した拡散を可能にします。グラデーションWebインターフェイスと加重プロンプトのサポートが含まれています。
bes -dev/stable_diffusion.openvino-OpenVinoと互換性のあるCPUを使用してモデルを実行するためのフォーク。
DreamArtist -1つのトレーニングイメージでDreamartistがコンテンツとスタイルを学習し、高い制御性を備えた多様な高品質の画像を生成します。 DreamArtistの埋め込みは、追加の説明と2つの学習した埋め込みと簡単に組み合わせることができます。 (スタンドアロンバージョン)
高速安定拡散 - ドリームブース統合を備えた速度に焦点を合わせたフォーク。
Gauss-ネイティブMacOS安定拡散アプリ。
想像力 - 安定した拡散画像のピトニック生成。複雑なテキストベースのマスキングをサポートするという点でユニークです。インタラクティブCLI、アップスケーリング、顔の強化、タイル張り、およびその他の標準機能があります。 GUIはありません。
Invoke -Ai/Invokeai-(以前はLSTEIN/STABLE -DIFFUSIONとして知られていました) - 非常にアクティブなフォーク会話型CLI、基本的なWebインターフェイス、GFPGAN、ESRGAN、コードフォーマー、加重プロンプト、プロンプトブレンド、ネガティブプロンプト、IMG2IMG、タイリング、 Apple M1への推論と同様に、テキストの反転と推論。
Kerascv stabled fusion-ケラスクでの安定した拡散の高性能実装。
Nicklucche/stable-diffusion-nvidia-docker-multi(nvidia)gpu有能なドッカーセットアップSDのセットアップ
Replicate/Copg-Stable-diffusion-SD v1.4のCog機械学習コンテナ。
stable-diffusion-jupyterlab-docker-安定した拡散のためにJupyterノートブックを使用する準備ができているDockerセットアップ。
runwayml/安定性拡散 - 高品質の開始のための特別にトレーニングされたインペインティングモデルを備えたrunwaymlによる安定した拡散分岐。
潜在的に古い/アクティブな枝が少ない
これらの支店は数ヶ月以上更新されておらず、歴史的な目的のためにここに保管されています
- neonsecret/stable拡散 - 速度を犠牲にしてより少ないVRAMでより大きな解像度に焦点を当て、GPUS能力に自動的に調整します。また、コードフォーマーとカスタムUIを介したアップスケーリング、顔の修復物も含まれます
チェックポイントとウェイト
チェックポイント(.ckptファイル)は個別にダウンロードする必要があり、安定した拡散を実行するには必要です。最新の安定性AIリリースは2.1です。 NSFWの概念を含む最後のモデルは、RunwayMLによって1.5リリースされました。
2.xリリースの場合、ベースモデル(512x512ピクセル)で訓練された768x768pxの解像度対応モデルがあります。安定した拡散を使用するには、これらのモデルのいずれかが必要であり、一般的にニーズに合った最新のモデルを選択したいと考えています。
- SD -2.1モデルカード(768x768px) - 安定した拡散2.1のモデルカード/ウェイト(拡散、アップスケーリング、パンティングチェックポイント)
- SD-2.1ベースモデルカード(512px512px) - 安定した拡散2.1のモデルカード/ウェイト(拡散、アップスケーリング、および入力チェックポイント)https://huggingface.co/stabilitai/stable-diffusion-2-1-base
- SD -2.0モデルカード - 安定した拡散2.0のモデルカード/ウェイト(拡散、アップスケーリング、パン処理チェックポイント)
- RunwayMLからのSD-V1-5-RunwayMLがリリースした安定した拡散1.5チェックポイント。
- 公式モデルカード1.5-モデルのすべてのバージョンで顔を抱き締める公式安定性AIモデルカード。ダウンロードには、サインインと利用規約の受け入れが必要です。
- stable-diffusion-v-1-4-original.chkpt-元の1.4モデルのカード
- Realesrganモデル - 多くのフォークによって実装されたアップスケーリング機能を使用するために必要な最新のRealesrganモデルの場所をダウンロードします。現実的なコンテンツとアニメコンテンツには、さまざまなモデルが存在します。フォークのドキュメントを参照して、あなたを識別してください
- runwaymlからのSD-V1-5インペインティング - runwaymlがリリースしたSD 1.5での開始のために最適化されたチェックポイント。
オンラインデモとノートブック
- Huggingface/Stability-ハグイングフェイススペースの公式デモ。
- ? Offical Colab- Google CloudでSDを実行するための公式の最適化されたコラブ。 VRAM要件により、Colab Proが画像を作成する必要があります。
- Andreasjansson/Stable-Diffusion-Animation-プロンプト間でアニメーション化します。
- Reforum- 2D、3D、ビデオ入力、および補間アニメーションを使用した安定した拡散のための高度なノートブック。開始、プロンプトバッチなどが含まれます。
- 安定した拡散補間-AA n補間画像の生成の簡単な実装(colab)
- Huggingface/diffuse -the -rest-残りを拡散します-IMG2IMGは、単純なスケッチまたはアップロードされた画像から。
補完的なモデルとツール
安定した拡散と組み合わせて使用するツールとモデル
- Civitaiモデルリポジトリ - カスタムモデルのリポジトリとテキストの反転埋め込み。
- プロンプトへのプロンプト - 画像編集を促すためのプロンプトのためのクロスアテンション制御の非公式の実装。
- SD-PROMPT-GRAPH-これは、安定した拡散で作られた迅速な補間アニメーションの反応ベースの曲線エディターGUIです。
- DAAM-拡散注意アトリビューションマップ、生成ヒートマップの生成最終的な拡散結果に対するプロンプトの特定の用語とトークンの影響をモデル化します。
- SD Concepts-Library-ユーザーのライブラリは、安定した拡散に新しい概念を追加するためのテキストインバージョン埋め込みを作成しました
トレーニング
Dreambooth-stable-diffusion-安定した拡散のためのGoogleのDreamboothの実装により、特定の概念のモデルを微調整できます。
LORA-LORA(低ランク適応)テキストからイメージまでの拡散微調整(UNET+クリップ)の高速で、DreamBoothよりも少ないRAMを必要とするより速く、より効率的な微調整方法。 Huggingfaceデモはこちら。
安定チューナー - 安定したチューナー、非常に快適なユーザーインターフェイスを備えたDreamBoothトレーナーを簡単にインストールできます。
安定した拡散トレーナー - スケーラブルなデータセットサイズとハードウェアの使用を備えた安定した拡散トレーナー。 10gのVRAMが必要です。
テキストインバージョン - モデルを再訓練せずに安定した拡散にパーソナライズされたコンテンツを追加します(Paper、Paper2)。
安定したDreamFusion-安定した拡散に基づく3D DreamFusionの実装からテキスト。
GUI
これらのGUIのほとんどは、ドキュメントに別段の言及されていない限り、安定した拡散が含まれます。
? Auto SDワークフロー-Lstein/Stable-Diffusion's Dream.pyのUI。画像合成に関する大規模/生産ワークフロー用の最適化されたUX。ビデオウォークスルー。
Carefree Creator(ローカルバージョン) - クリエーター/アーティスト中心のワークフローを備えたユーザーフレンドリーなGUI。
cmdr2/stable-diffusion-ui-別の、WindowsおよびLinuxにUIを使用できます。
diffusionbee -macosの自己包括的バイナリアプリ。
diffusionui -dall -eを使用したdall -eに触発されたvue.jsで作られたWeb UIは、インドーティングに最適です。ビデオデモ
Kiri.art(以前のSD-MUI) - 複数のモデルを備えたモバイルファーストPWA(WAIFU拡散を含む)。ローカルで無料で実行するか、ライブサイトで無料および有料クレジットを使用します。 React + Materialsuiで構築されています。 (ソースコード) MIT License TypeScript
? NMKD GUI -Windows UI、完全に紹介されています。クローズドソース。あなた自身の価格を選んでください。
SD-Webui/Stable-Diffusion-Webui-オプションの非常に特徴的なグラデーションUIとTXT2IMGのサポート、IMG2IMG INPAINTING、GFPGAN、ESRGAN、加重プロンプト、最適化された低メモリバージョン、オプションのテキストインバージョンなどを備えた非常にアクティブなフォーク。
安定した拡散グリスクGUI -SD用のWindows GUIバイナリ。閉じたソースなので、あなた自身の責任で使用してください。
安定した拡散インフィニティ - 無限のキャンバスインターフェイスで塗装するための概念の証明。 (強力なGPUが必要です)。
不安定な融合-Inpainting、IMG2Imgなどの安定した拡散デスクトップフロントエンド
Stable-Diffusion-Webui-Docker-最も人気のあるフォークを統合するドッカーベースのフロントエンド。
Synesthetic-リミックスに焦点を当てたプロンプト検索エンジンとジェネレーター
アップスケーリング
- BasicsR-いくつかのモデルをサポートするオープンソースのアップスケーリングと復元ツールボックス。
- BSRGAN -BSRGAN -UpScalingの劣化画像に特化した別のアップスケーリングソリューション。
- カップスケール-EsrganやRealesrganを含むさまざまなアップスケーリングモデルを実行するためのGUI。
- Realesrgan -Esrgan Upscaling(2x、4x)およびコンテンツの復元。 Python:
pip install realesrgan - jquesnelle/txt2imghd- progrockdiffusionからのGoBigモードのポートで、TXT2IMGの上に高品質のアップスケーリングを提供します。
- アップスケールWikiモデルデータベース-Esrgan et al。
コンテンツの復元
- LAMA -CLEANER -CONTENT CONTENT AWARE AI Inpainting Toolは、画像から不要なオブジェクトや欠陥を削除するのに役立ちます。 Python:
pip install lama-cleaner - GFPGAN -SD出力で一般的に見られる顔の変形を自動的に固定するために、いくつかのフォークに含まれています。
- コードフォーマー - 別の顔の修復モデル(論文)。
タスクチェーン
- Chainner-画像処理タスクをチェーンするためのグラフィックノードベースのエディター。
- AI-art-Generator-AI ART Generation Suiteは、安定した拡散とその他のモデルを組み合わせて、大量のアート生成のためのモデルを組み合わせています。
- DFSERVER分散バックエンドAIパイプラインサーバーは、安定した拡散とさまざまなAI画像または迅速な構築モデルを実行するために、自己ホスト分散分散GPUクラスターを構築します。
迅速な建物
プロンプトは、拡散モデルに出力を操作するための指示です。
Stable Diffusion Prompt Book -Openaiの安定した拡散プロンプトブック、プロンプトエンジニアリングに関する非常に包括的なリソース。
ai -art.com/modifiers-キーワード用の視覚リファレンスガイド。
aipromptguide.com-スタイル、修飾子、アーティスト、人の視覚データベース
aitransformerプロンプトビルダー - テキストの構築を支援するのは、画像からテキストツールを使用して、画像から詳細なテキストの説明を生成し、800以上の特別なテキストの反転条件を生成し、サンプル画像を使用して頻繁に使用したジェネリック用語を生成します。
krea.ai-クリックするプロンプトと同様のプロンプトを推奨するプロンプト検索エンジン。
- アカウントの作成を使用すると、自分のコレクションでプロンプトを好み、保存できます。
lexica.art-それらを作成するために使用される画像の検索可能な視覚的なデータベースとプロンプト設定。
Pharmapsychotic/lip -interrogator -jupyterノートブックは、クリップモデルを使用して、特定の画像(デモ)に似た画像のプロンプトを提案します。
Phraser-例のデータベースを描く視覚的なプロンプトビルダー。 (アカウントの作成が必要です)
PROMPTHERO =別の視覚的なプロンプトビルダーとリファレンスライブラリ。
PropentMominai-視覚的な迅速な構築ツール。
ROM1504/Clip -Retrieval-安定した拡散およびその他のモデル(オンラインGUI)のトレーニングで使用されるデータセットのプロンプトキーワードを検索します。 Automatic1111のようないくつかのGUIには、この機能が含まれます。
安定した拡散プロンプトジェネレーター - 特定のテキストプロンプトを改善するための提案を提供します。
PROMPSSEARCH-さらに別の安定した拡散検索エンジンですが、パブリックAPIがあります
同じエネルギー - 同じ「エネルギー」を持つ画像を返す視覚検索エンジン。
publicPrompts-パブリックプロムプスのコレクション
特殊なユーザーケース
- Dream -Textures-テクスチャの作成のための安定した拡散を活用するブレンダーアドオン。
- Stable-DreamFusion-Googleのテキストから3Dドリームフュージョンペーパーのオープンソースの実装は、ImageGenが安定した拡散に置き換えられました。
チュートリアルと比較
チュートリアルと高品質の教育リソース
起きて実行します
- 安定した拡散方法 - 安定した拡散を実行して実行するための基本的なチュートリアル。
- Windowsへのインストール - Windowsでの安定した拡散のインストールとランニングに関するガイド。
- M1 Apple Siliconでの実行-Redditスレッドは、Apple M1 CPUおよびGPUで安定した拡散を実行する手順を備えています。
- 簡単なCPUのみの安定した拡散 - GNU/LinuxのCPUのみの安定拡散を依存関係に散らさずにCPUのみの安定した拡散をセットアップするためのガイド。
- 「Ultimate GUI Retard Guide」 - SD -Webuiフォークをインストールするためのチュートリアル。
学習とマスタリング
- 安定した拡散Akashic Records-ガイド、研究、キーワード、プロンプト、アーティストの包括的なキュレーションのリスト。
- Sunny's Tips&Tricks -Sunny's SDのヒント&トリックGoogle Docは、多くの視覚的な比較と有用な情報を備えています。
- AI画像ジェネレーターの比較 - Dall -E、Stable Diffusion、およびMidjourneyの視覚的比較Petapixel.com。
- 安定した拡散で素晴らしい結果を得る - 吸わない画像の生成に関するガイド。
- イラストされた安定した拡散 - 安定した拡散の仕組みに関する図解された入門書。
- コーダーのための実用的な深い学習 - 安定した拡散を含む深い学習の多くの側面をカバーするコーダーを対象とした高品質のコース。
- トップSDアーティスト - サンプル画像を使用した安定した拡散で知られるアーティストの検索可能なリスト。
研究
- 修飾子研究 - 人気のある修飾子/キーワードの視覚的研究。
- アーティスト研究 - さまざまなアーティストの視覚的研究。
機能の拡張
- SD Discordボットの構築 - Pythonを使用した安定した拡散不一致ボットの構築に関するチュートリアル。
コミュニティリソース
- 安定した拡散の1週間 - 安定した拡散サービス、適応、ユーザーインターフェイス、統合のキュレーションリスト。
- Pharmapsychotic.com/tools-安定した拡散を含むがこれらに限定されないAIアート向けのツールとリソースのキュレーションされたリスト。
- 安定した拡散リソース - ガイド、チュートリアル、最高のソフトウェアなど、安定した拡散に関する差し迫った質問に答えるための徹底的なリソース。
ソーシャルメディア
- r/stabledfusion-安定した拡散subreddit。 (半公式)
- r/sdforall -sdforall
- 拡散パルス - 毎週安定した拡散ニュースレター
サードパーティアプリ用のプラグイン
- ブレンダープラグイン - 無料の3Dモデリングソフトウェアブレンダー用プラグイン
- GIMPプラグイン - GIMPプラグイン。
- Kritaプラグイン - クリタとGIMP SDプラグイン
- Krita 5.0プラグイン - 人気のある自動1111フォークに基づく別のKritaプラグイン。
- Photoshopプラグイン-PhotoshopのSD(Adobe Exchange)
安定した拡散を実装する商用SaaSとアプリ
- ? ai artジェネレーター(iOS)-IOSアプリは、安定した拡散を使用してアートを生成します。
- aiimagegenerator.org-安定した拡散を使用して画像を生成するための無料のオンラインアートジェネレーター。 TXT2IMGおよびIMG2IMGの生成とインピンティングをサポートします。
- Aitransformer-安定した拡散に基づくスーパースタイライザーを含む無料のオンライン画像/ビデオ変換ツールは、TXT2IMG、IMG2IMG、IMG2TXT(Clip -interrogator)をサポートします。
- ? Barium.ai-テキストからPBR(物理ベースのレンダリング)テクスチャを生成します。無料および有料プラン。
- ? Canva Text-to-Image-Canvaからのテキストからイメージ(ベータ)サービス
- ? Dream Studio-安定した拡散の作成者であるStabilityAiによるオンラインアート生成サービス。 Dall-EやMidjourneyなどのサービスと同様に、これはクレジットモデルで動作し、毎月サインアップされたユーザーに提供されたクレジットの無料手当があります。
- ? dream.ai- wombo.aiによるオンラインアート生成サービス(モバイルアプリが利用可能)。
- ? Gimmeapis-サードパーティのREST API安定拡散サービス。
- ?画像コンピューター - 技術以外の人々を対象とした使いやすいサービス(無料のトライアルクレジットが付属しています)
- ? Neural.love- 2022年10月現在、寛大な無料クレジットを備えた別のオンラインアートジェネレーター。
- ? Replicate.com安定した拡散 - 安定した拡散のための別のSaaSの提供。
- ? Starry AI(iOS) - プリセットアートスタイルを使用した安定した拡散を提供する別のiOSアプリ。
- Stable Horde-分散した安定した拡散クラスター(@Homeをfolding@Homeと考えてください)、Web、Discord、およびTelegram Interfacesを使用して、GPUと結合することで優先されます。
- ? APIとしての安定した拡散 - サードパーティのREST APIへのテーブル拡散サービスへ。
屋根裏部屋 - 以前のリンクは、非活動のために廃止されました
- LowFuel/Progrock -Stable -Optional Web GUIとアップスケーリングへの異なるアプローチを備えたフォーク(GoBig/Esrgan)
- TXT2IMGHD-プログロック拡散のフォーク。最初にプロンプトから画像を生成し、アップスケーリングしてから、アップスケーリングされた画像の小さなピースでIMG2IMGを実行し、結果を元の画像にブレンドします。