ctrlora 다운로드 ctrlora 소스 코드 다운로드

ctrlora

AI 소스 코드

1.0.0

다운로드

스타일 트랜스퍼

로딩 속도를 위해 이미지가 압축됩니다.

ctrlora

ctrlora : 제어 가능한 이미지 생성을위한 확장적이고 효율적인 프레임 워크
Yifeng Xu ^1,2 , Zhenliang HE ¹ , Shiguang Shan ^1,2 , Xilin Chen ^1,2
¹ AI 안전 실험실, CAS, CAS, CAS, CAS SAIFY의 주요 실험실
² 중국 과학 아카데미, 중국

기본 조건

먼저 대규모 데이터 세트를 사용하여 기본 조건에 대한 조건 별 LORA 와 함께 기본 컨트롤 넷을 훈련시킵니다. 그런 다음 기본 제어 컨트롤 단일 GPU에서 1,000 개의 이미지와 1 시간 미만 .

? 시각적 결과

? "기본 조건"에 대한 제어 가능한 생성

? "소설 조건"에 대한 제어 가능한 세대

? 커뮤니티 모델 및 다중 조건 세대로의 통합

? 스타일 전송 신청

설치

이 저장소를 복제하십시오.

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

새로운 콘다 환경을 만들고 활성화하십시오.

conda create -n ctrlora python=3.10
conda activate ctrlora

Pytorch 및 기타 종속성을 설치하십시오.

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

? ️ 새끼 고려 된 모델을 다운로드하십시오

우리는 여기에 사기꾼 모델을 제공합니다. Base Controlnet ( ctrlora_sd15_basecn700k.ckpt )을 ./ckpts/ctrlora-basecn 에 넣고 loras를 ./ckpts/ctrlora-loras 에 넣으십시오. loras의 명명 대회는 기본 조건에 대한 ctrlora_sd15_<basecn>_<condition>.ckpt 및 ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt 입니다.

또한 SD1.5 기반 모델을 다운로드하여 ./ckpts/sd15 에 넣어야합니다. 우리의 작업에 사용 된 모델 :

안정적인 확산 v1.5 ( v1-5-pruned.ckpt ) : 공식 / 미러
현실적인 비전
드림 셰이퍼
안개문 애니메이션
만화 아가씨
유화
잉크 펑크
중국 잉크 코믹 스트립
슬레이트 연필 믹스
Aziib 픽셀 믹스

Gradio 데모

python app/gradio_ctrlora.py

1/4 개의 512x512 이미지의 배치를 생성하려면 최소 9GB/21GB GPU RAM이 필요합니다.

단일 조건 세대

안정적인 확산 체크 포인트, 기본 Controlnet Checkpoint 및 LORA 체크 포인트를 선택하십시오.
프롬프트와 부정적인 프롬프트를 작성하십시오. 우리는 일반적으로 사용되는 몇 가지 프롬프트를 제공합니다.
조건 이미지를 준비하십시오
- "조건"패널의 왼쪽에 이미지를 업로드하고 LORA에 해당하는 전처리기를 선택하고 "감지"를 클릭하십시오.
- 또는 조건 이미지를 직접 업로드하고 "없음"사전 처리기를 선택하고 "감지"를 클릭하십시오.
"실행"을 클릭하여 이미지를 생성하십시오.
새 체크 포인트를 업로드하면 Gradio를 다시 시작하거나 "새로 고침"을 클릭하십시오.

Gradio

다중 조건 세대

Gradio2

스타일 전송 신청

양식화 된 안정 확산 체크 포인트를 선택하여 대상 스타일 (예 : 픽셀)을 지정하십시오.
기본 Controlnet Checkpoint를 선택하십시오.
LORA1 체크 포인트 및 LORA2 체크 포인트의 Lineart 의 팔레트를 선택하십시오.
- 팔레트 + 캐니 또는 팔레트 + hed도 작동합니다. 아마도 더 흥미로운 조합이 발견 될 수 있습니다.
프롬프트와 부정적인 프롬프트를 작성하십시오.
소스 이미지를 "조건 1"패널에 업로드하고 "없음" 사전 처리기를 선택하고 "감지"를 클릭하십시오.
소스 이미지를 "조건 2"패널에 업로드하고 "Lineart" Preprocessor를 선택하고 "감지"를 클릭하십시오.
"기본 옵션"패널에서 두 조건의 가중치를 조정하십시오.
"실행"을 클릭하여 이미지를 생성하십시오.

Gradio3

맞춤 조건을 위해 로라를 훈련 시키십시오

기본 Controlnet을 기반으로 한 단일 GPU (20GB)에서 1,000 개의 이미지와 1 시간 미만의 사용자 정의 상태에 대해 LORA를 훈련시킬 수 있습니다.

ctrlora_sd15_basecn700k.ckpt , 안정적인 확산 v1.5 ( v1-5-pruned.ckpt )를 ./ckpts/sd15 ./ckpts/ctrlora-basecn 다운로드하십시오.

둘째, 다음 구조로 사용자 정의 데이터를 ./data/<custom_data_name> 에 넣으십시오.

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source 캐니 가장자리, 세분화 맵, 깊이 이미지 등과 같은 조건 이미지가 포함되어 있습니다.
target 에는 조건 이미지에 해당하는 지상 진실 이미지가 포함되어 있습니다.
prompt.json 의 각 라인 json {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."} .

셋째, 다음 명령을 실행하여 사용자 정의 조건에 대해 LORA를 훈련시킵니다.

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : 사용자 정의 데이터의 경로.
--name : 실험 이름. 로깅 디렉토리는 ./runs/name 입니다. 기본값 : 현재 시간.
--max_steps : 최대 교육 단계 수. 기본값 : 100000 .

훈련 후 다음 명령으로 로라 가중치를 추출하십시오.

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : 위의 교육에 의해 생성 된 체크 포인트로가는 경로.
--save_path : 추출 된 로라 중량을 저장하는 경로.

마지막으로 추출 된 로라를 ./ckpts/ctrlora-loras 에 넣고 Gradio 데모에 사용하십시오.

자세한 지침

교육, 미세 조정 및 평가에 대한 자세한 내용은 여기에 지침을 참조하십시오.

? 승인

이 프로젝트는 안정적인 확산, 컨트롤 넷 및 유니어 제어를 기반으로합니다. 그들의 위대한 일에 감사드립니다!

안정적인 확산 v1.5 : https://github.com/runwayml/stable-diffusion
Controlnet v1.0 : https://github.com/lllyasviel/controlnet
Controlnet v1.1 : https://github.com/lllyasviel/controlnet-v1-nightly
Unicontrol : https://github.com/salesforce/unicontrol

? ️ 인용

이 프로젝트가 도움이된다면 다음과 같은 인용을 고려하십시오.

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}