Скачать ctrlora - Скачать исходный код ctrlora

ctrlora

AI Исходный код

1.0.0

Скачать

Баннер

Стиль-перенос

Изображения сжаты для скорости загрузки.

Ctrlora

Ctrlora: расширяемая и эффективная структура для управляемого генерации изображений
Yifeng Xu ^1,2 , Zhenliang He ¹ , Shiguang Shan ^1,2 , Xilin Chen ^1,2
¹ ключевая лаборатория безопасности ИИ, Институт компьютерных технологий, Кас, Китай
² Университета китайской академии наук, Китай

базовые кондиционер

Сначала мы тренируем базовую контрольную сеть вместе с LORAS, специфичными для состояния, на базовых условиях с крупномасштабным набором данных. Затем наш базовый контрольный сеть может быть эффективно адаптирован к новым условиям новым лорасом с всего лишь 1000 изображений и менее 1 часа на одном графическом процессоре Полем

? Визуальные результаты

? Контролируемое генерация на «базовых условиях»

? Контролируемое поколение на «новых условиях»

? Интеграция в модели сообщества и многокондиционированное поколение

? Применение в стиле переноса

Установка

Клонировать это репо:

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

Создайте и активируйте новую среду Conda:

conda create -n ctrlora python=3.10
conda activate ctrlora

Установите Pytorch и другие зависимости:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

? ️ Скачать предварительные модели

Мы предоставляем наши предварительные модели здесь. Пожалуйста, поместите базовый ControlNet ( ctrlora_sd15_basecn700k.ckpt ) в ./ckpts/ctrlora-basecn и loras в ./ckpts/ctrlora-loras . Конвенция о именовании лораса - ctrlora_sd15_<basecn>_<condition>.ckpt для базовых условий и ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt для новых условий.

Вы также должны загрузить модели на основе SD1.5 и поместить их в ./ckpts/sd15 . Модели, используемые в нашей работе:

Стабильная диффузия v1.5 ( v1-5-pruned.ckpt ): официальное / зеркало
Реалистичное видение
Dreamshaper
Mistoon Anime
Комические малышки
Масляная живопись
Черниль
Китайская чернила комикса
Смесь для карандашей
Aziib Pixel Mix

Демо

python app/gradio_ctrlora.py

Требуется не менее 9 ГБ/21 ГБ ОЗУ графического процессора, чтобы генерировать партию из одного/четыре изображения 512x512.

Однокондиционное поколение

Выберите контрольную точку стабильной диффузии, контрольную точку Base Controlnet и контрольную точку LORA.
Напишите подсказки и негативные подсказки. Мы предоставляем несколько часто используемых подсказок.
Приготовьте изображение состояния
- Загрузите изображение слева от панели «Условие», выберите препроцессор, соответствующий Лоре, и нажмите «Обнаружение».
- или загрузите изображение условия напрямую, выберите препроцессор «Нет» и нажмите «Обнаружение».
Нажмите «Запустить», чтобы сгенерировать изображения.
Если вы загрузите какие -либо новые контрольно -пропускные пункты, перезапустите Gradio или нажмите «Обновление».

градио

Многоугольное поколение

Gradio2

Применение в стиле переноса

Выберите стилизованный стабильный диффузионный контрольно -пропускной пункт, чтобы указать целевой стиль, например, Pixel.
Выберите контрольную точку Base Controlnet.
Выберите палитру для контрольной точки LORA1 и Lineart для контрольной точки LORA2.
- Палитра + хэмпская или палитра + хед также работают, возможно, есть более интересные комбинации, которые будут обнаружены
Напишите подсказки и негативные подсказки.
Загрузите исходное изображение на панель «Условие 1», выберите препроцессор «Нет» и нажмите «Обнаружение».
Загрузите исходное изображение на панель «Условие 2», выберите препроцессор «Lineart» и нажмите «Обнаружение».
Отрегулируйте вес для двух условий на панели «Основные параметры».
Нажмите «Запустить», чтобы сгенерировать изображения.

Gradio3

Тренируйте Lora для вашего пользовательского состояния

Основываясь на нашем базовом контроле, вы можете обучить Lora для вашего пользовательского состояния с лишним всего 1000 изображений и менее 1 часа на одном GPU (20 ГБ).

Во-первых, загрузите стабильную диффузию v1.5 ( v1-5-pruned.ckpt ) в ./ckpts/sd15 и базовый контроль ( ctrlora_sd15_basecn700k.ckpt ) в ./ckpts/ctrlora-basecn , как описано выше.

Во -вторых, поместите свои пользовательские данные в ./data/<custom_data_name> со следующей структурой:

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source содержит изображения условий, такие как хитрые края, карты сегментации, глубинные изображения и т. Д.
target содержит образы истины заземления, соответствующие изображениям состояния.
Каждая строка prompt.json должна следовать формату, например {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."} .

В -третьих, запустите следующую команду для обучения LORA для вашего пользовательского условия:

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : Путь к пользовательским данным.
--name : имя эксперимента. Каталог журнала будет ./runs/name . По умолчанию: текущее время.
--max_steps : максимальное количество обучающих этапов. По умолчанию: 100000 .

После тренировки извлеките вес веса LORA следующей командой:

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : Путь к контрольно-пропускной пункте, созданный приведенным выше тренингом.
--save_path : путь к сохранению извлеченных весов Lora.

Наконец, поместите извлеченную Lora в ./ckpts/ctrlora-loras и используйте его в демонстрации Gradio.

Подробные инструкции

Пожалуйста, обратитесь к инструкциям здесь для получения более подробной информации о обучении, точной настройке и оценке.

? Подтверждение

Этот проект построен на стабильной диффузии, ControlNet и Unicontrol. Спасибо за отличную работу!

Стабильная диффузия v1.5: https://github.com/runwayml/stable-diffusion
ControlNet v1.0: https://github.com/lllyasviel/controlnet
ControlNet v1.1: https://github.com/lllyasviel/controlnet-v1-1-nightly
Unicontrol: https://github.com/salesforce/unicontrol

? ️ цитирование

Если вы найдете этот проект полезным, пожалуйста, рассмотрите возможность ссылаться на:

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}