Dreambooth Stable Diffusion下载 - Dreambooth Stable Diffusion源代码下载

Dreambooth Stable Diffusion

其他源码

1.0.0

下载

Yushan的扩展Dreambooth如何指导

用于在vast.ai上跑步
用于在Google Colab上运行
用于在本地PC（Windows）上运行
用于在本地PC（Ubuntu）上运行
适应走廊数字的Dreambooth教程到Joepenna的仓库
在Joepenna的Dreambooth中使用标题

指数

乔·佩纳的笔记
设置
- 简单的runpod说明
- vast.ai设置
- 本地运行
  - VENV
  - 康达
- 配置文件和命令行参考
字幕和多个主题/概念支持
文字反转与Dreambooth
使用生成的模型
调试结果
- 他们看起来根本不像你！
- 他们看起来像你，但就像你的训练图像一样
- 他们看起来像你，但是当你尝试不同的样式时不
拥抱脸部扩散器

仓库以前称为“ Dreambooth”

乔·佩纳的笔记

介绍！

你好！我叫乔·佩纳（Joe Penna）。

您可能已经在MysteryguitArman下看过一些我的YouTube视频。我现在是故事片导演。您可能已经看到北极或储藏室。

对于我的电影，我需要能够培训特定的演员，道具，位置等。因此，我对 @xavierxiao的回购进行了许多更改，以训练人们的脸。

我无法发布正在拍摄的电影的所有测试，但是当我用自己的脸测试时，我会在Twitter页面上释放这些测试 - @mysteryguitarm。

这些测试中有很多是与我的一个伙伴一起完成的 - 来自Corridordigital的Niko。可能是您找到此存储库的方式！

我不是真正的编码员。我只是固执，我不怕谷歌搜索。因此，最终，一些非常聪明的人加入了并一直在做出贡献。在此存储库中，特别是：@djbielejeski @gammagec @mrsaad - 但我们的不和谐中有很多其他！

这不再是我的回购。这是whan-wanna-see-dreambooth-n-sd-sd-working-well's Repo！

现在，如果您想尝试这样做...请首先阅读下面的警告：

警告！

让我们尊重花费多年磨练自己技能的人们的辛勤工作和创造力。
- 这种Dreambooth的迭代专为数字艺术家而设计，可以训练自己的角色和样式为稳定的扩散模型，以及人们训练自己的肖像。我的主要目标是使电影制片人与他们雇用的概念艺术家互动 - 生成最初想法的种子，以便他们可以在视觉上进行交流。旨在由电影制片人，概念艺术家，漫画设计师等使用。
- 有一天，将在完美的数据集上进行稳定的扩散。同时，出于道德 /道德 /潜在的法律原因，我强烈建议将别人的艺术培训到这些模型中（除非您获得了明确的许可，否则他们已经对这项技术发表了公开声明）。出于类似的原因，我建议不要在您的提示中使用艺术家的名字。不要让那些使这能成为可能的人！
进入技术方面：
- 现在，您可以在使用24GB的VRAM （例如3090）上运行此操作。培训将较慢，您需要确保这是唯一运行的程序。
- 如果像我一样，您碰巧没有其中之一，那么我在此处包括一本jupyter笔记本，以帮助您在租用的云计算平台上运行它。
- 它目前是针对Runpod.io和vast.ai量身定制的
- 我们也支持COLAB笔记本：
该实现并未完全实施Google关于如何保留潜在空间的想法。
- 大多数类似于您训练的图像都会转向这一点。
- 例如，如果您正在训练一个人，所有人都会看起来像您。如果您正在训练一个对象，那班上的任何东西看起来都像您的对象。
似乎没有一个简单的方法可以连续训练两个主题。修剪之前，您最终将获得11-12GB文件。
- 提供的笔记本有一个修剪器将其缩小到~2gb
最好的做法是将令牌更改为名人名称（注意：令牌，而不是上课- 因此您的提示将是： Chris Evans person ）。这是我的妻子接受了完全相同的设置训练，除了令牌

设置

简单的runpod说明

请注意，Runpod会定期升级其基本Docker映像，这可能导致回购不起作用。 YouTube视频都没有最新的视频，但您仍然可以跟随它们作为指导。沿着典型的Runpod YouTube视频/教程进行以下更改：

从“我的豆荚”页面中

单击菜单按钮（紫色播放按钮的左侧）
单击编辑吊舱
更新以下一个“ Docker Image Name”（测试2023/06/27）：
- runpod/pytorch:3.10-2.0.1-120-devel
- runpod/pytorch:3.10-2.0.1-118-runtime
- runpod/pytorch:3.10-2.0.0-117
- runpod/pytorch:3.10-1.13.1-116
单击保存。
重新启动您的豆荚

继续指南的其余部分：

注册Runpod。请随时在此处使用我的推荐链接，这样我就不必付费（但是您这样做）。
登录后，选择SECURE CLOUD或COMMUNITY CLOUD
确保您找到“高”临时速度
选择至少24GB VRAM，例如RTX 3090，RTX 4090或RTX A5000
按照以下这些视频说明：

vast.ai说明

注册vast.ai（David Bielejeski的推荐链接）
添加一些资金（我通常以10美元的增量添加它们）
导航到客户端 - 创建页面
- 选择pytorch/pytorch作为您的docker映像，然后选择“使用jupyter实验室接口”和“ jupyter direct https”
您将需要增加磁盘空间，然后在GPU RAM上过滤（2GB检查点文件 + 2-8GB型号文件 +正则化图像 +其他东西快速添加）
- 我通常分配150GB
- 也可以很好地检查上传/下载速度以获取足够的带宽，这样您就不会花所有的钱等待下载内容。
选择您想要的实例，然后单击Rent ，然后转到您的实例页面，然后单击“ Open
- 您将获得不安全的证书警告。单击警告或安装庞大的证书。
单击Notebook -> Python 3 （您可以通过多种方式执行此操作，但我通常会这样做）
克隆·乔（Clone Joe）的回购与此命令
- !git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion.git
- 单击run
在左侧浏览新的Dreambooth-Stable-Diffusion目录，然后打开dreambooth_simple_joepenna.ipynb或dreambooth_runpod_joepenna.ipynb文件
遵循工作簿中的说明并开始培训

在本地运行

设置 - 虚拟环境

先决条件

git
Python 3.10
打开cmd
克隆存储库
1. C:>git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion
导航到存储库
1. C:>cd Dreambooth-Stable-Diffusion

安装依赖关系并激活环境

cmd > python -m venv dreambooth_joepenna
cmd > dreambooth_joepennaScriptsactivate.bat
cmd > pip install torch == 1.13.1+cu117 torchvision == 0.14.1+cu117 --extra-index-url https://download.pytorch.org/whl/cu117
cmd > pip install -r requirements.txt

跑步

cmd> python "main.py" --project_name "ProjectName" --training_model "C:v1-5-pruned-emaonly-pruned.ckpt" --regularization_images "C:regularization_images" --training_images "C:training_images" --max_training_steps 2000 --class_word "person" --token "zwx" --flip_p 0 --learning_rate 1.0e-06 --save_every_x_steps 250

清理

cmd > deactivate

设置-Conda

先决条件

git
Python 3.10
Miniconda3
打开Anaconda Prompt (miniconda3)
克隆存储库
1. (base) C:>git clone https://github.com/JoePenna/Dreambooth-Stable-Diffusion
导航到存储库
1. (base) C:>cd Dreambooth-Stable-Diffusion

安装依赖关系并激活环境

(base) C:Dreambooth-Stable-Diffusion > conda env create -f environment.yaml
(base) C:Dreambooth-Stable-Diffusion > conda activate dreambooth_joepenna

跑步

cmd> python "main.py" --project_name "ProjectName" --training_model "C:v1-5-pruned-emaonly-pruned.ckpt" --regularization_images "C:regularization_images" --training_images "C:training_images" --max_training_steps 2000 --class_word "person" --token "zwx" --flip_p 0 --learning_rate 1.0e-06 --save_every_x_steps 250

清理

cmd > conda deactivate

配置文件和命令行参考

示例配置文件

 {
    "class_word": "woman",
    "config_date_time": "2023-04-08T16-54-00",
    "debug": false,
    "flip_percent": 0.0,
    "gpu": 0,
    "learning_rate": 1e-06,
    "max_training_steps": 3500,
    "model_path": "D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt",
    "model_repo_id": "",
    "project_config_filename": "my-config.json",
    "project_name": "<token> project",
    "regularization_images_folder_path": "D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim",
    "save_every_x_steps": 250,
    "schema": 1,
    "seed": 23,
    "token": "<token>",
    "token_only": false,
    "training_images": [
        "001@a photo of <token> looking down.png",
        "002-DUPLICATE@a close photo of <token> smiling wearing a black sweatshirt.png",
        "002@a photo of <token> wearing a black sweatshirt sitting on a blue couch.png",
        "003@a photo of <token> smiling wearing a red flannel shirt with a door in the background.png",
        "004@a photo of <token> wearing a purple sweater dress standing with her arms crossed in front of a piano.png",
        "005@a close photo of <token> with her hand on her chin.png",
        "005@a photo of <token> with her hand on her chin wearing a dark green coat and a red turtleneck.png",
        "006@a close photo of <token>.png",
        "007@a close photo of <token>.png",
        "008@a photo of <token> wearing a purple turtleneck and earings.png",
        "009@a close photo of <token> wearing a red flannel shirt with her hand on her head.png",
        "011@a close photo of <token> wearing a black shirt.png",
        "012@a close photo of <token> smirking wearing a gray hooded sweatshirt.png",
        "013@a photo of <token> standing in front of a desk.png",
        "014@a close photo of <token> standing in a kitchen.png",
        "015@a photo of <token> wearing a pink sweater with her hand on her forehead sitting on a couch with leaves in the background.png",
        "016@a photo of <token> wearing a black shirt standing in front of a door.png",
        "017@a photo of <token> smiling wearing a black v-neck sweater sitting on a couch in front of a lamp.png",
        "019@a photo of <token> wearing a blue v-neck shirt in front of a door.png",
        "020@a photo of <token> looking down with her hand on her face wearing a black sweater.png",
        "021@a close photo of <token> pursing her lips wearing a pink hooded sweatshirt.png",
        "022@a photo of <token> looking off into the distance wearing a striped shirt.png",
        "023@a photo of <token> smiling wearing a blue beanie holding a wine glass with a kitchen table in the background.png",
        "024@a close photo of <token> looking at the camera.png"
    ],
    "training_images_count": 24,
    "training_images_folder_path": "D:\stable-diffusion\training_images\24 Images - captioned"
}

使用您的配置进行培训

 python "main.py" --config_file_path "path/to/the/my-config.json"

命令行参数

dreambooth_helpers gragments.py

命令	类型	例子	描述
`--config_file_path`	细绳	`"C:\Users\David\Dreambooth Configs\my-config.json"`	要使用的配置文件的路径
`--project_name`	细绳	`"My Project Name"`	该项目的名称
`--debug`	布尔	`False`	可选默认为`False` 。启用调试记录
`--seed`	int	`23`	可选默认值为`23` 。种子的种子
`--max_training_steps`	int	`3000`	训练步骤的数量
`--token`	细绳	`"owhx"`	您要代表训练有素的模型的独特令牌。
`--token_only`	布尔	`False`	可选默认为`False` 。仅使用令牌而没有课程的训练。
`--training_model`	细绳	`"D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt"`	训练模型的途径（model.ckpt）
`--training_images`	细绳	`"D:\stable-diffusion\training_images\24 Images - captioned"`	训练图像目录的途径
`--regularization_images`	细绳	`"D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim"`	使用正规化图像的目录路径
`--class_word`	细绳	`"woman"`	将class_word匹配到您要训练的图像类别。示例： `man` ， `woman` ， `dog`或`artstyle` 。
`--flip_p`	漂浮	`0.0`	可选默认值为`0.5` 。翻转百分比。示例：如果设置为`0.5` ，将在50％的时间内翻转（镜像）您的训练图像。这有助于扩展您的数据集，而无需包括更多的培训图像。这可能会导致面部训练的结果更糟，因为大多数人的面孔并不是完全对称的。
`--learning_rate`	漂浮	`1.0e-06`	可选默认值为`1.0e-06` （0.000001）。设置学习率。接受科学符号。
`--save_every_x_steps`	int	`250`	可选默认值为`0` 。为每个X步骤保存一个检查站。在达到`max_training_steps`时，仅在`0`时才保存。
`--gpu`	int	`0`	可选默认值为`0` 。指定除0以外的GPU用于培训。当前尚未实施多GPU支持。

使用您的配置进行培训

 python "main.py" --project_name "My Project Name" --max_training_steps 3000 --token "owhx" --training_model "D:\stable-diffusion\models\v1-5-pruned-emaonly-pruned.ckpt" --training_images "D:\stable-diffusion\training_images\24 Images - captioned" --regularization_images "D:\stable-diffusion\regularization_images\Stable-Diffusion-Regularization-Images-person_ddim\person_ddim" --class_word "woman" --flip_p 0.0 --save_every_x_steps 500

字幕和多个主题/概念支持

支持字幕。这是我们如何实施它们的指南。

假设您的代币是Effy，您的班级是人，您的数据root是 /训练：

training_images/img-001.jpg为effy person加上字幕

您可以通过在文件名中的@符号之后添加字幕来自定义字幕。

/training_images/img-001@a photo of effy => a photo of effy

您可以在字幕中使用两个令牌S大写s-和C大写C-来指示主题和类。

/training_images/img-001@S being a good C.jpg => effy being a good person

要创建一个新主题，您只需要为其创建一个文件夹即可。所以：

/training_images/bingo/img-001.jpg => bingo person

该课程保持不变，但是现在主题已经改变。

再次 - 令牌S现在是宾果游戏：

/training_images/bingo/img-001@S is being silly.jpg bingo is being silly

一个文件夹更深入，您可以更改类： /training_images/bingo/dog/img-001@S being a good C.jpg => bingo being a good dog

毫无启动者：更深入一个级别，您可以为图像组标题：/triending_images/effy/person/a a picture of effy person /training_images/effy/person/a picture of/img-001.jpg =>

文字反转与Dreambooth

此存储库中的大部分代码是由Rinon Gal等人撰写的。 Al，文本反演研究论文的作者。尽管出于MIT团队和Google的研究人员的尊重，但还增加了有关正规化图像和先前保存（“ Dreambooth”的想法）的一些想法（“ Dreambooth”的想法），但我正在将此叉命名为： “以前被称为“回购” Dreambooth“” 。

有关替代实现，请参见下面的“替代选项”。

使用生成的模型

ground truth （真实的图片，谨慎：非常美丽的女人）

下面所有这些图像的提示相同：

`sks person`	`woman person`	`Natalie Portman person`	`Kate Mara person`

调试结果

❗❗人犯的第一级错误❗❗

仅提示您的令牌。即“ Joepenna”，而不是“ Joepenna Person”

如果您在person的joepenna训练中，模型只能知道您的脸为：

 joepenna person

示例提示：

不正确（在joepenna之后失踪person ）

 portrait photograph of joepenna 35mm film vintage glass

✅这是正确的（在joepenna之后包括person ）

 portrait photograph of joepenna person 35mm film vintage glass

有时，您可能会得到一个与Joepenna看起来像您一样的人（尤其是如果您经过了太多步骤训练），但这仅仅是因为当前的Dreambooth过度训练的迭代使图像如此之多，以至于它会流血到那个代币中。

☢请小心您训练的图像类型

在训练期间，马stable不知道你是一个人。它只是模仿它看到的。

因此，如果这些是您的培训图像，则看起来像这样：

您只会以...的风格，即自拍照片的风格，穿着一件白色和灰色的衬衫，将几代人的几代人带到一棵尖刺的树旁边。

相反，这套训练组好多了：

图像之间唯一一致的是主题。因此，稳定将浏览图像并仅学习您的脸部，这将使其“编辑”为其他样式。

哦，不！您几代人没有好！

选项1：他们看起来根本不像您！（训练更长的时间，或获得更好的培训图像）

您确定要提示吗？

它应该是<token> <class> ，而不仅仅是<token> 。例如：

JoePenna person, portrait photograph, 85mm medium format photo

如果它看起来仍然不像您，那么您的训练时间不会足够长。

选项2：他们看起来像您，但看起来都像您的培训图像。（训练更少的步骤，获得更好的培训图像，通过提示修复）

好的，原因是：您可能已经训练了太久了……或者您的图像太相似了……或者您没有训练足够的图像。

没问题。我们可以通过提示来解决这个问题。稳定的扩散对您首先输入的任何内容都具有很大的优点。因此，请保存以备以稍后：

an exquisite portrait photograph, 85mm medium format photo of JoePenna person with a classic haircut

选项3：他们看起来像您，但尝试不同的样式时不像您。（训练更长的训练，获得更好的培训图像）

你没有足够长的时间...

没问题。我们可以通过提示来解决此问题：

JoePenna person in a portrait photograph, JoePenna person in a 85mm medium format photo of JoePenna person

更多提示和帮助：稳定的扩散梦boot骨不和谐

拥抱面部扩散器 - 替代选择

现在，Dreambooth在拥抱面扩散器方面得到了支持，可以通过稳定的扩散进行训练。

在这里尝试：

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-02-25
大小 14.09MB
来自于 Github

Dreambooth Stable Diffusion

Yushan的扩展Dreambooth如何指导

指数

仓库以前称为“ Dreambooth”

乔·佩纳的笔记

介绍！

警告！

设置

简单的runpod说明

继续指南的其余部分：

vast.ai说明

在本地运行

设置 - 虚拟环境

先决条件

安装依赖关系并激活环境

跑步

清理

设置-Conda

先决条件

安装依赖关系并激活环境

跑步

清理

配置文件和命令行参考

示例配置文件

使用您的配置进行培训

命令行参数

使用您的配置进行培训

字幕和多个主题/概念支持

文字反转与Dreambooth

使用生成的模型

调试结果

❗❗人犯的第一级错误❗❗

☢请小心您训练的图像类型

哦，不！您几代人没有好！

选项1：他们看起来根本不像您！ （训练更长的时间，或获得更好的培训图像）

选项2：他们看起来像您，但看起来都像您的培训图像。 （训练更少的步骤，获得更好的培训图像，通过提示修复）

选项3：他们看起来像您，但尝试不同的样式时不像您。 （训练更长的训练，获得更好的培训图像）

更多提示和帮助：稳定的扩散梦boot骨不和谐

拥抱面部扩散器 - 替代选择

选项1：他们看起来根本不像您！（训练更长的时间，或获得更好的培训图像）

选项2：他们看起来像您，但看起来都像您的培训图像。（训练更少的步骤，获得更好的培训图像，通过提示修复）

选项3：他们看起来像您，但尝试不同的样式时不像您。（训练更长的训练，获得更好的培训图像）