Téléchargement de ctrlora - Téléchargement du code source ctrlora

ctrlora

Code Source AI

1.0.0

Télécharger

bannière

transfert de style

Les images sont compressées pour la vitesse de chargement.

Ctrlora

Ctrlora: un cadre extensible et efficace pour la génération d'images contrôlables
Yifeng Xu ^1,2 , Zhenliang He ¹ , Shiguang Shan ^1,2 , Xilin Chen ^1,2
¹ laboratoire clé de la sécurité de l'IA, Institut de technologie informatique, CAS, Chine
² Université de l'Académie des sciences chinoises, Chine

conditions de base

Nous entraînons d'abord un contrôle de base avec des loras spécifiques à la condition sur des conditions de base avec un ensemble de données à grande échelle. Ensuite, notre contrôle de base peut être efficacement adapté à de nouvelles conditions par de nouveaux loras avec aussi peu que 1 000 images et moins de 1 heure sur un seul GPU .

? Résultats visuels

? Génération contrôlable sur les "conditions de base"

? Génération contrôlable sur "nouvelles conditions"

? Intégration dans les modèles communautaires et la génération multi-conditionnelle

? Application au transfert de style

Installation

Cloner ce repo:

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

Créer et activer un nouvel environnement conda:

conda create -n ctrlora python=3.10
conda activate ctrlora

Installez Pytorch et autres dépendances:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

? ️ Télécharger des modèles pré-entraînés

Nous fournissons nos modèles pré-entraînés ici. Veuillez mettre le ControlNet de base ( ctrlora_sd15_basecn700k.ckpt ) dans ./ckpts/ctrlora-basecn et les loras dans ./ckpts/ctrlora-loras . La convention de dénomination des Loras est ctrlora_sd15_<basecn>_<condition>.ckpt pour les conditions de base et ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt pour les conditions nouvelles.

Vous devez également télécharger les modèles basés sur SD1.5 et les mettre dans ./ckpts/sd15 . Modèles utilisés dans notre travail:

STABLE DIFFUSION V1.5 ( v1-5-pruned.ckpt ): officiel / miroir
Vision réaliste
DreamShaper
Anime de brouillard
Bandes dessinées
Peinture à l'huile
Inkpunk
Bande dessinée chinoise à l'encre
Mélange de crayons d'ardoise
Mélange de pixels aziib

Demo Gradio

python app/gradio_ctrlora.py

Nécessite au moins 9 Go / 21 Go de RAM GPU pour générer un lot de 1 / quatre images 512x512.

Génération unique

Sélectionnez le point de contrôle de diffusion stable, le point de contrôle de base ControlNet et le point de contrôle LORA.
Écrivez des invites et des invites négatives. Nous fournissons plusieurs invites couramment utilisées.
Préparer une image de condition
- Téléchargez une image à gauche du panneau "Condition", sélectionnez le préprocesseur correspondant à la LORA et cliquez sur "détecter".
- ou téléchargez directement l'image de condition, sélectionnez le préprocesseur "Aucun", et cliquez sur "détecter".
Cliquez sur "Exécuter" pour générer des images.
Si vous téléchargez de nouveaux points de contrôle, redémarrez Gradio ou cliquez sur "Rafraîchir".

gradio

Génération multi-conditionnelle

gradio2

Application au transfert de style

Sélectionnez un point de contrôle de diffusion stable stylisé pour spécifier le style cible, par exemple, pixel.
Sélectionnez le point de contrôle ControlNet de base.
Sélectionnez la palette pour le point de contrôle LORA1 et le lineart pour le point de contrôle LORA2.
- Palette + Canny ou Palette + HED Aussi aussi, il y a peut-être des combinaisons plus intéressantes à découvrir
Écrivez des invites et des invites négatives.
Téléchargez l'image source dans le panneau "Condition 1", sélectionnez le préprocesseur "None" , puis cliquez sur "détecter".
Téléchargez l'image source dans le panneau "Condition 2", sélectionnez le préprocesseur "Lineart" et cliquez sur "détecter".
Ajustez les poids des deux conditions dans le panneau "Options de base".
Cliquez sur "Exécuter" pour générer des images.

gradio3

Entraîner une lora pour votre état personnalisé

Sur la base de notre ControlNet de base, vous pouvez entraîner une LORA pour votre état personnalisé avec aussi peu que 1 000 images et moins de 1 heure sur un seul GPU (20 Go).

Tout d'abord, téléchargez la diffusion stable v1.5 ( v1-5-pruned.ckpt ) dans ./ckpts/sd15 et le ControlNet de base ( ctrlora_sd15_basecn700k.ckpt ) dans ./ckpts/ctrlora-basecn comme décrit ci-dessus.

Deuxièmement, mettez vos données personnalisées dans ./data/<custom_data_name> avec la structure suivante:

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source contient des images de condition, telles que les bords émaux, les cartes de segmentation, les images de profondeur, etc.
target contient des images à travers le sol correspondant aux images de condition.
Chaque ligne d' prompt.json doit suivre le format comme {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."} .

Troisièmement, exécutez la commande suivante pour former la Lora pour votre condition personnalisée:

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : chemin vers les données personnalisées.
--name : nom de l'expérience. Le répertoire de journalisation sera ./runs/name . Par défaut: heure actuelle.
--max_steps : nombre maximum d'étapes de formation. Par défaut: 100000 .

Après l'entraînement, extraire les poids LORA avec la commande suivante:

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : Chemin vers le point de contrôle produit par la formation ci-dessus.
--save_path : chemin pour sauver les poids LORA extraits.

Enfin, mettez la lora extraite dans ./ckpts/ctrlora-loras et utilisez-la dans la démo Gradio.

Instructions détaillées

Veuillez vous référer aux instructions ici pour plus de détails sur la formation, le réglage fin et l'évaluation.

? Reconnaissance

Ce projet est construit sur une diffusion stable, ControlNet et UniControl. Merci pour leur excellent travail!

Diffusion stable v1.5: https://github.com/runwayml/stable-diffusion
CONTROLNET V1.0: https://github.com/lllyasviel/controlnet
ControlNet v1.1: https://github.com/lllyasviel/controlnet-v1-1- nightly
Unicontrol: https://github.com/salesforce/UniControl

? ️ Citation

Si vous trouvez ce projet utile, veuillez envisager de citer:

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-02
taille 14.26MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout