Unduh ctrlora - Unduh Kode Sumber ctrlora

ctrlora

Kode Sumber AI

1.0.0

Unduh

spanduk

gaya-transfer

Gambar dikompresi untuk kecepatan pemuatan.

Ctrlora

Ctrlora: Kerangka kerja yang diperluas dan efisien untuk pembuatan gambar yang dapat dikendalikan
Yifeng Xu ^1,2 , Zhenliang HE ¹ , Shiguang Shan ^1,2 , Xilin Chen ^1,2
¹ Lab Kunci Keselamatan AI, Institut Teknologi Komputasi, CAS, China
² Universitas Akademi Ilmu Pengetahuan Tiongkok, Cina

Kondisi dasar

Kami pertama-tama melatih ControlNet dasar bersama dengan Loras khusus kondisi pada kondisi dasar dengan dataset skala besar. Kemudian, controlnet dasar kami dapat secara efisien disesuaikan dengan kondisi baru oleh Loras baru dengan Sedikitnya 1.000 gambar dan kurang dari 1 jam pada satu GPU .

? Hasil visual

? Pembuatan yang dapat dikendalikan pada "kondisi dasar"

? Generasi yang dapat dikendalikan pada "kondisi novel"

? Integrasi ke dalam model komunitas & generasi multi-kondisi

? Aplikasi ke Transfer Gaya

Instalasi

Klon repo ini:

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

Buat dan aktifkan lingkungan Conda baru:

conda create -n ctrlora python=3.10
conda activate ctrlora

Instal Pytorch dan dependensi lainnya:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

? ️ Unduh model pretrained

Kami menyediakan model pretrained kami di sini. Harap masukkan controlNet dasar ( ctrlora_sd15_basecn700k.ckpt ) ke ./ckpts/ctrlora-basecn dan loras ke ./ckpts/ctrlora-loras . Konvensi penamaan Loras adalah ctrlora_sd15_<basecn>_<condition>.ckpt untuk kondisi dasar dan ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt untuk kondisi baru.

Anda juga perlu mengunduh model berbasis SD1.5 dan memasukkannya ke ./ckpts/sd15 . Model yang digunakan dalam pekerjaan kami:

Difusi stabil v1.5 ( v1-5-pruned.ckpt ): resmi / cermin
Visi yang realistis
Dreamshaper
Anime Mistoon
Comic Babes
Lukisan minyak
Tinta
Comic-strip tinta Cina
Campuran pensil batu tulis
Campuran piksel aziib

Demo Gradio

python app/gradio_ctrlora.py

Membutuhkan setidaknya 9GB/21GB GPU RAM untuk menghasilkan batch satu/empat gambar 512x512.

Generasi Single-Conditional

Pilih pos pemeriksaan difusi yang stabil, pos pemeriksaan ControlNet dasar, dan pos pemeriksaan LORA.
Tuliskan petunjuk dan petunjuk negatif. Kami menyediakan beberapa petunjuk yang umum digunakan.
Siapkan Gambar Kondisi
- Unggah gambar di sebelah kiri panel "kondisi", pilih preprocessor yang sesuai dengan Lora, dan klik "Deteksi".
- Atau unggah gambar kondisi secara langsung, pilih preprocessor "None", dan klik "Deteksi".
Klik "Jalankan" untuk menghasilkan gambar.
Jika Anda mengunggah pos pemeriksaan baru, restart gradio atau klik "Refresh".

gradio

Generasi multi-kondisional

gradio2

Aplikasi ke Transfer Gaya

Pilih pos pemeriksaan difusi stabil yang bergaya untuk menentukan gaya target, misalnya, piksel.
Pilih pos pemeriksaan ControlNet dasar.
Pilih palet untuk pos pemeriksaan LORA1 dan lineart untuk pos pemeriksaan LORA2.
- palet + canny atau palet + hed juga berfungsi, mungkin ada kombinasi yang lebih menarik untuk ditemukan
Tuliskan petunjuk dan petunjuk negatif.
Unggah gambar sumber ke panel "Kondisi 1", pilih preprocessor "None" , dan klik "Deteksi".
Unggah gambar sumber ke panel "Kondisi 2", pilih preprocessor "lineart" , dan klik "Deteksi".
Sesuaikan bobot untuk dua kondisi di panel "Opsi Dasar".
Klik "Jalankan" untuk menghasilkan gambar.

gradio3

Latih Lora untuk kondisi khusus Anda

Berdasarkan ControlNet dasar kami, Anda dapat melatih LORA untuk kondisi khusus Anda dengan sedikitnya 1.000 gambar dan kurang dari 1 jam pada GPU tunggal (20GB).

Pertama, unduh difusi stabil v1.5 ( v1-5-pruned.ckpt ) ke ./ckpts/sd15 dan basis controlnet ( ctrlora_sd15_basecn700k.ckpt ) ke ./ckpts/ctrlora-basecn seperti dijelaskan di atas.

Kedua, masukkan data khusus Anda ke ./data/<custom_data_name> dengan struktur berikut:

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

source berisi gambar kondisi, seperti tepi cerdik, peta segmentasi, gambar kedalaman, dll.
target berisi gambar kebenaran tanah yang sesuai dengan gambar kondisi.
Setiap baris prompt.json harus mengikuti format seperti {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."} .

Ketiga, jalankan perintah berikut untuk melatih Lora untuk kondisi khusus Anda:

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : Path to the Custom Data.
--name : Nama percobaan. Direktori logging adalah ./runs/name . Default: Waktu saat ini.
--max_steps : Jumlah langkah-langkah pelatihan maksimum. Default: 100000 .

Setelah pelatihan, ekstrak bobot Lora dengan perintah berikut:

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : Path to checkpoint yang dihasilkan oleh pelatihan di atas.
--save_path : jalur untuk menyimpan bobot lora yang diekstraksi.

Akhirnya, masukkan lora yang diekstraksi ke dalam ./ckpts/ctrlora-loras dan gunakan dalam demo gradio.

Instruksi terperinci

Silakan merujuk pada instruksi di sini untuk detail lebih lanjut tentang pelatihan, penyempurnaan, dan evaluasi.

? Pengakuan

Proyek ini dibangun di atas difusi yang stabil, CONTROLNET, dan unicontrol. Terima kasih atas pekerjaan hebat mereka!

Difusi stabil v1.5: https://github.com/runwayml/stable-diffusion
CONTROLNET V1.0: https://github.com/lllyasviel/controlnet
ControlNet v1.1: https://github.com/lllyasviel/contrrolnet-v1-1-nightly
Unicontrol: https://github.com/salesforce/unicontrol

? ️ Kutipan

Jika Anda menemukan proyek ini bermanfaat, silakan pertimbangkan mengutip:

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-02
ukuran 14.26MB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua