image_generation_using_stable_diffusion
パート1:安定した拡散
- ライブラリのインストール(Xformersライブラリへのメモリ最適化へ)
- 画像生成のためのパイプライン:プロンプトの作成 - >画像の生成 - >結果の保存
- 複数の画像を生成します
- パラメーター:シード、推論ステップ、ガイダンススケール(CFG)、画像サイズ(寸法)、ネガティブプロンプト
- その他のモデル:SD V1.5、SD V2.X、特定のスタイルを備えた微調整モデル
- スケジューラの変更:PNDM(デフォルト)、DDIMスケジューラ、K-LMSスケジューラ、オイラーの先祖の離散スケジューラ(オイラーA)、DPMスケジューラ
パート2:プロンプトエンジニアリング
- プロンプトの探索:サブジェクト /オブジェクト、アクションと場所、タイプ、スタイル、色、アーティスト、解像度、サイト。その他の属性:イルミネーション、ネガティブプロンプト
- ユースケース:芸術の生成、写真の生成、ランドスケープの生成、3D画像の生成、図面の生成、アーキテクチャの生成
- カスタムモデルを使用した結果の改善:Anything(CAG/Anything-V3-1)、Dreamshaper(Lykon/Dreamshaper)、Realistic Vision(SG161222/Realistic_Vision_V1.4)、アナログ拡散(Wavymulder/Analog-difusion)、Protogen(darkstorm2150/protogen_x3.4_x3.4__ficimimimimimimimimimimimimimimimimimimimimimimimimimimimigimimimimimimimimimimigimimigimimigimimimigimimigial (Mitsua/Mitsua-Diffusion-one)
パート3:微調整
- ライブラリのインストール(Accelerate Transformers ftfy bitsandbytes == 0.35.0 Gradio Natsort Safetensors Xformers)
- モデルのロード
- トレーニング:3つのコンポーネントが必要です:一意の識別子、クラス名、画像
- 重みを(チェックポイント)に変換します
- 推論(テスト)
- 画像の生成:複数のプロンプトのテスト、よりプロンプトの例:森、カイロ、カイロ砂漠、西部のシーン、スターウォーズ、山岳富士、雪の中など。
- 結果を保存します
パート4:画像から画像へ
- ライブラリのインストール(Accelerate Transformers ftfy bitsandbytes == 0.35.0 Gradio Natsort Safetensors Xformers)
- 画像を生成します
- 強度パラメーター(強度)
- さまざまなスタイルのテスト
- 入力画像の変更
- スケジューラの変更
- 画像「編集」(instructpix2pix)
パート5:開始
- ライブラリのインストール(Accelerate Transformers ftfy bitsandbytes == 0.35.0 Gradio Natsort Safetensors Xformers)
- プロンプトの作成
- オブジェクトを交換します
- 結果の比較(他の画像、複数の画像の生成)
パート6:ControlNet
- ライブラリのインストール(Accelerate Transformers Xformers)
- エッジを使用した画像の生成(ControlNetモデル + Canny Edge、Canny Edgeを使用したエッジの検出、微調整モデル)
- ポーズを使用して画像を生成します