ctrlora下载ctrlora源代码下载

ctrlora

Ai源码

1.0.0

下载

样式转移

图像被压缩以进行加载速度。

ctrlora

Ctrlora：可控制图像生成的可扩展有效框架
Yifeng Xu ^1,2 ，Zhenliang He ¹ ，Shiguang Shan ^1,2 ，Xilin Chen ^1,2
^1个AI安全的关键实验室，计算技术研究所，CAS，中国
²中国科学院，中国

基本条件

我们首先在具有大规模数据集的基本条件下训练基本控制网以及条件特定的洛拉斯。然后，我们的基本控制网络可以有效地适应新的洛拉斯的新条件单个GPU上只有1,000张图像，不到1小时。

？视觉结果

？在“基本条件”上可控的生成

？在“新条件”上可控的一代

？集成到社区模型和多条件生成中

？申请样式转移

安装

克隆这个仓库：

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

创建并激活新的Conda环境：

conda create -n ctrlora python=3.10
conda activate ctrlora

安装Pytorch和其他依赖关系：

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

？

我们在这里提供验证的模型。请将基本控制网（ ctrlora_sd15_basecn700k.ckpt ）放入./ckpts/ctrlora-basecn和loras和loras中./ckpts/ctrlora-loras 。 Loras的命名约定为ctrlora_sd15_<basecn>_<condition>.ckpt用于基本条件， ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt 。

您还需要下载基于SD1.5的型号，并将其放入./ckpts/sd15中。我们工作中使用的模型：

稳定扩散v1.5（ v1-5-pruned.ckpt ）：官方 /镜像
现实的愿景
Dreamshaper
雾动漫
漫画宝贝
油画
inkpunk
中国墨水漫画
石板铅笔混合
Aziib像素混合物

Gradio演示

python app/gradio_ctrlora.py

至少需要9GB/21GB GPU RAM来生成一批/四个512x512图像。

单条件生成

选择稳定的扩散检查点，基本控制网络检查点和LORA检查点。
写提示和负面提示。我们提供了几个常用的提示。
准备条件图像
- 将图像上传到“条件”面板的左侧，选择与Lora相对应的预处理器，然后单击“检测”。
- 或直接上传条件图像，选择“无”预处理器，然后单击“检测”。
单击“运行”以生成图像。
如果您上传任何新检查点，请重新启动Gradio或单击“刷新”。

Gradio

多条件生成

Gradio2

申请样式转移

选择一个程式化的稳定扩散检查点以指定目标样式，例如像素。
选择基本控制网检查点。
为LORA1检查点选择调色板，然后为LORA2检查点进行Lineart 。
- 调色板 + Canny或Palette + HED也起作用，也许可以发现更多有趣的组合
写提示和负面提示。
将源图像上传到“条件1”面板，选择“无”预处理器，然后单击“检测”。
将源图像上传到“条件2”面板，选择“ Lineart”预处理器，然后单击“检测”。
调整“基本选项”面板中两个条件的权重。
单击“运行”以生成图像。

Gradio3

训练洛拉（Lora）为您的自定义状况

根据我们的基本控制网络，您可以在单个GPU（20GB）上训练Lora的自定义状况，少于1,000张图像，少于1小时。

首先，将稳定的扩散v1.5（ v1-5-pruned.ckpt ）下载到./ckpts/sd15中，然后将基本控制网（ ctrlora_sd15_basecn700k.ckpt ）下载到./ckpts/ctrlora-basecn中。

其次，将您的自定义数据放入./data/<custom_data_name>具有以下结构：

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source包含条件图像，例如浓缩边缘，分割图，深度图像等。
target包含与条件图像相对应的地面真实图像。
prompt.json的每一行应遵循{"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."}格式。

第三，运行以下命令以训练LORA的自定义条件：

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot ：自定义数据的路径。
--name ：实验的名称。记录目录将为./runs/name 。默认值：当前时间。
--max_steps ：最大训练步骤数。默认值： 100000 。

训练后，用以下命令提取洛拉权重：

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt ：上述训练产生的检查点的路径。
--save_path ：节省提取的洛拉权重的路径。

最后，将提取的Lora放入./ckpts/ctrlora-loras中，并将其用于Gradio演示中。

详细说明

请参阅此处的说明，以获取更多培训，微调和评估的详细信息。

？致谢

该项目建立在稳定的扩散，控制网和Unicontrol之上。感谢他们的出色工作！

稳定扩散v1.5：https：//github.com/runwayml/stable-diffusion
ControlNet V1.0：https：//github.com/lllyasviel/controlnet
ControlNet V1.1：https：//github.com/lllyasviel/controlnet-v1-1-nightly
Unicontrol：https：//github.com/salesforce/unicontrol

引用

如果您发现此项目有帮助，请考虑引用：

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}