Descargar ctrlora - Descargar el código fuente de ctrlora

ctrlora

Código Fuente de IA

1.0.0

Descargar

bandera

transferencia de estilo

Las imágenes están comprimidas para la velocidad de carga.

Ctrlora

Ctrlora: un marco extensible y eficiente para la generación de imágenes controlables
Yifeng Xu ^1,2 , Zhenliang He ¹ , Shiguang Shan ^1,2 , Xilin Chen ^1,2
¹ Laboratorio clave de seguridad de IA, Instituto de Tecnología de Computación, CAS, China
² Academia de Ciencias de la Universidad de China, China

condiciones de base

Primero entrenamos una red de control base junto con loras específicas de condición en condiciones base con un conjunto de datos a gran escala. Luego, nuestra red base se puede adaptar de manera eficiente a condiciones novedosas por las nuevas loras con tan solo 1,000 imágenes y menos de 1 hora en una sola GPU .

? Resultados visuales

? Generación controlable en "condiciones base"

? Generación controlable en "condiciones novedosas"

? Integración en modelos comunitarios y generación multi-condicional

? Aplicación a la transferencia de estilo

Instalación

Clon este repositorio:

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

Crear y activar un nuevo entorno de condena:

conda create -n ctrlora python=3.10
conda activate ctrlora

Instale Pytorch y otras dependencias:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

? ️ Descargar modelos previos a la aparición

Proporcionamos nuestros modelos previos a la aparición aquí. Por favor, coloque el control base ( ctrlora_sd15_basecn700k.ckpt ) en ./ckpts/ctrlora-basecn y loras en ./ckpts/ctrlora-loras . La convención de nombres de LORAS es ctrlora_sd15_<basecn>_<condition>.ckpt para condiciones base y ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt para condiciones novedosas.

También debe descargar los modelos basados en SD1.5 y ponerlos en ./ckpts/sd15 . Modelos utilizados en nuestro trabajo:

Difusión estable V1.5 ( v1-5-pruned.ckpt ): Oficial / Mirror
Visión realista
Shaper
Anime de muy
Chicas cómicas
Pintura al óleo
Tinta
Chino cómico de tinta
Mezcla de lápiz de pizarra
Mezcla de píxeles de aziib

Demostración de Gradio

python app/gradio_ctrlora.py

Requiere al menos 9GB/21 GP GPU RAM para generar un lote de una/cuatro imágenes 512x512.

Generación única

Seleccione el punto de control de difusión estable, el punto de control de control de base base y el punto de control de Lora.
Escribir indicaciones y indicaciones negativas. Proporcionamos varias indicaciones comúnmente utilizadas.
preparar una imagen de condición
- Cargue una imagen a la izquierda del panel "Condición", seleccione el preprocesador correspondiente al Lora y haga clic en "Detectar".
- o cargue la imagen de condición directamente, seleccione el preprocesador "Ninguno" y haga clic en "Detectar".
Haga clic en "Ejecutar" para generar imágenes.
Si carga cualquier punto de control nuevo, reinicie Gradio o haga clic en "Actualizar".

Gradio

Generación multi-condicional

Gradio2

Aplicación a la transferencia de estilo

Seleccione un punto de control de difusión estable estilizado para especificar el estilo de destino, por ejemplo, píxel.
Seleccione el punto de control de Base Controlnet.
Seleccione la paleta para el punto de control Lora1 y Lineart para el punto de control Lora2.
- Paleta + Canny o Palette + HED también funcionan, tal vez hay combinaciones más interesantes para descubrir
Escribir indicaciones y indicaciones negativas.
Cargue la imagen de origen en el panel "Condición 1", seleccione el preprocesador "Ninguno" y haga clic en "Detectar".
Cargue la imagen de origen en el panel "Condición 2", seleccione el preprocesador "LineArt" y haga clic en "Detectar".
Ajuste los pesos para las dos condiciones en el panel "Opciones básicas".
Haga clic en "Ejecutar" para generar imágenes.

Gradio3

Capacite una lora para su condición personalizada

Basado en nuestra base base, puede entrenar un lora para su condición personalizada con tan solo 1,000 imágenes y menos de 1 hora en una sola GPU (20 GB).

Primero, descargue la difusión estable v1.5 ( v1-5-pruned.ckpt ) en ./ckpts/sd15 y el control base ( ctrlora_sd15_basecn700k.ckpt ) en ./ckpts/ctrlora-basecn como se describió anteriormente.

En segundo lugar, coloque sus datos personalizados en ./data/<custom_data_name> con la siguiente estructura:

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source contiene imágenes de condición, como bordes canales, mapas de segmentación, imágenes de profundidad, etc.
target contiene imágenes de verdad en tierra correspondientes a las imágenes de condición.
Cada línea de prompt.json debe seguir el formato como {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."}

Tercero, ejecute el siguiente comando para entrenar la Lora para su condición personalizada:

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : ruta a los datos personalizados.
--name : nombre del experimento. El directorio de registro será ./runs/name . Valor predeterminado: hora actual.
--max_steps : número máximo de pasos de entrenamiento. Valor predeterminado: 100000 .

Después del entrenamiento, extraiga los pesos de Lora con el siguiente comando:

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : Ruta al punto de control producido por el entrenamiento anterior.
--save_path : ruta para guardar los pesos de lora extraídos.

Finalmente, coloque el Lora extraído en ./ckpts/ctrlora-loras y úselo en la demostración de Gradio.

Instrucciones detalladas

Consulte las instrucciones aquí para obtener más detalles de capacitación, ajuste y evaluación.

? Reconocimiento

Este proyecto se basa en difusión, control de control y unicontrol estables. ¡Gracias por su gran trabajo!

Difusión estable V1.5: https://github.com/runwayml/stable-diffusion
Controlnet v1.0: https://github.com/lllyasviel/Controlnet
Controlnet v1.1: https://github.com/lllyasviel/controlnet-v1-1-1-nightly
Unicontrol: https://github.com/salesforce/unicontrol

? ️ cita

Si encuentra útil este proyecto, considere citar:

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-02
tamaño 14.26MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo