Download ctrlora - Download de código fonte ctrlora

ctrlora

Código-Fonte de IA

1.0.0

Baixar

bandeira

Transferência de estilo

As imagens são compactadas para velocidade de carregamento.

Ctrlora

Ctrlora: uma estrutura extensível e eficiente para geração de imagem controlável
Yifeng Xu ^1,2 , Zhenliang He ¹ , Shiguang Shan ^1,2 , Xilin Chen ^1,2
¹ Laboratório -chave de segurança da IA, Instituto de Tecnologia de Computação, CAS, China
² Academia de Ciências da Universidade de Chinesa, China

Condições de base

Primeiro, treinamos uma rede de controle base, juntamente com os Loras específicos da condição nas condições básicas com um conjunto de dados em larga escala. Em seguida, nossa rede de controle base pode ser adaptada com eficiência a novas condições por novos loras com apenas 1.000 imagens e menos de 1 hora em uma única GPU .

? Resultados visuais

? Geração controlável em "condições básicas"

? Geração controlável em "Novas Condições"

? Integração em modelos comunitários e geração multi-condicional

? Aplicação para transferência de estilo

Instalação

Clone este repo:

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

Crie e ativar um novo ambiente do CONDA:

conda create -n ctrlora python=3.10
conda activate ctrlora

Instale Pytorch e outras dependências:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

? Iquudar modelos pré -traidos

Fornecemos nossos modelos pré -rastreados aqui. Coloque o controle base ( ctrlora_sd15_basecn700k.ckpt ) em ./ckpts/ctrlora-basecn e os loras em ./ckpts/ctrlora-loras . A Convenção de Nomeação dos Loras é ctrlora_sd15_<basecn>_<condition>.ckpt para condições básicas e ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt para novas condições.

Você também precisa baixar os modelos baseados em SD1.5 e colocá-los em ./ckpts/sd15 . Modelos usados em nosso trabalho:

Difusão estável v1.5 ( v1-5-pruned.ckpt ): oficial / espelho
Visão realista
Dreamshaper
Anime em brilho
Bebês cômicos
Pintura a óleo
Inkpunk
Tira em quadrinhos de tinta chinesa
Mistura de lápis de ardósia
Aziib Pixel Mix

Demo Gradio

python app/gradio_ctrlora.py

Requer pelo menos 9 GB/21 GB de RAM para gerar um lote de uma/quatro imagens de 512x512.

Geração única condicional

Selecione o ponto de verificação de difusão estável, o ponto de verificação do controle de base e o ponto de verificação Lora.
Escreva avisos e avisos negativos. Fornecemos vários avisos comumente usados.
Prepare uma imagem de condição
- Carregue uma imagem à esquerda do painel "Condição", selecione o pré -processador correspondente ao Lora e clique em "Detectar".
- ou carregue a imagem da condição diretamente, selecione o pré -processador "Nenhum" e clique em "Detect".
Clique em "Executar" para gerar imagens.
Se você enviar novos pontos de verificação, reinicie o graduado ou clique em "Atualizar".

Gradio

Geração multi-condicional

gradio2

Aplicação para transferência de estilo

Selecione um ponto de verificação de difusão estável estilizado para especificar o estilo de destino, por exemplo, pixel.
Selecione o ponto de verificação do controle de base.
Selecione Paleta para o ponto de verificação Lora1 e Lineart para o ponto de verificação LORA2.
- Paleta + Canny ou Palette + Hed também trabalham, talvez haja combinações mais interessantes a serem descobertas
Escreva avisos e avisos negativos.
Carregue a imagem de origem para o painel "Condição 1", selecione o pré -processador "nenhum" e clique em "Detectar".
Carregue a imagem de origem no painel "Condição 2", selecione o pré -processador "Lineart" e clique em "Detectar".
Ajuste os pesos para as duas condições no painel "Opções básicas".
Clique em "Executar" para gerar imagens.

gradio3

Treine uma lora para sua condição personalizada

Com base no nosso ControlNet Base, você pode treinar uma LORA para sua condição personalizada com apenas 1.000 imagens e menos de 1 hora em uma única GPU (20 GB).

Primeiro, faça o download da difusão estável v1.5 ( v1-5-pruned.ckpt ) em ./ckpts/sd15 e a base controlnetNet ( ctrlora_sd15_basecn700k.ckpt ) em ./ckpts/ctrlora-basecn , conforme descrito acima.

Segundo, coloque seus dados personalizados em ./data/<custom_data_name> com a seguinte estrutura:

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source contém imagens de condição, como bordas de Canny, mapas de segmentação, imagens de profundidade, etc.
target contém imagens de verdadeira-verdade correspondente às imagens de condição.
Cada linha de prompt.json deve seguir o formato como {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."} .

Terceiro, execute o seguinte comando para treinar a Lora para sua condição personalizada:

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : caminho para os dados personalizados.
--name : nome do experimento. O diretório de registro será ./runs/name . Padrão: hora atual.
--max_steps : Número máximo de etapas de treinamento. Padrão: 100000 .

Após o treinamento, extraia os pesos da Lora com o seguinte comando:

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : caminho para o ponto de verificação produzido pelo treinamento acima.
--save_path : caminho para salvar os pesos da Lora extraídos.

Finalmente, coloque o Lora extraído em ./ckpts/ctrlora-loras e use-o na demonstração do Gradio.

Instruções detalhadas

Consulte as instruções aqui para obter mais detalhes de treinamento, ajuste fino e avaliação.

? Reconhecimento

Este projeto é construído sobre difusão estável, controlnet e unicontrol. Obrigado pelo seu ótimo trabalho!

Difusão estável v1.5: https://github.com/runwayml/stable-diffusion
Controlnet v1.0: https://github.com/lllyasviel/controlnet
ControlNet v1.1: https://github.com/lllyasviel/controlnet-v1-1-nightly
Unicontrol: https://github.com/salesforce/unicontrol

? Aste

Se você achar esse projeto útil, considere citar:

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-02
tamanho 14.26MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos