تنزيل ctrlora - تنزيل رمز المصدر ctrlora

ctrlora

كود الذكاء الاصطناعي

1.0.0

تنزيل

لافتة

النمط الناقد

يتم ضغط الصور لتحميل سرعة.

كترورا

Ctrlora: إطار عمل قابل للتمديد وفعال لتوليد الصور يمكن التحكم فيه
Yifeng Xu ^1،2 ، Zhenliang He ¹ ، Shiguang Shan ^1،2 ، Xilin Chen ^1،2
¹ مختبر رئيسي لسلامة الذكاء الاصطناعي ، معهد تكنولوجيا الحوسبة ، CAS ، الصين
² جامعة أكاديمية العلوم الصينية ، الصين

الشروط الأساسية

نقوم أولاً بتدريب ControlNet إلى جانب LORAs الخاصة بالظروف على ظروف قاعدة مع مجموعة بيانات واسعة النطاق. بعد ذلك ، يمكن تكييف ControlNet القاعدة لدينا بكفاءة مع ظروف جديدة من قبل Loras New أقل من 1000 صورة وأقل من ساعة واحدة على وحدة معالجة الرسومات الواحدة .

؟ النتائج البصرية

؟ جيل يمكن التحكم فيه على "الظروف الأساسية"

؟ جيل يمكن التحكم فيه على "الظروف الجديدة"

؟ التكامل في نماذج المجتمع وجيل متعدد المشروط

؟ تطبيق لنقل النمط

تثبيت

استنساخ هذا الريبو:

git clone --depth 1 https://github.com/xyfJASON/ctrlora.git
cd ctrlora

إنشاء وتفعيل بيئة كوندا جديدة:

conda create -n ctrlora python=3.10
conda activate ctrlora

تثبيت Pytorch والتبعيات الأخرى:

pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117
pip install -r requirements.txt

؟ ️ قم بتنزيل النماذج المسبقة

نحن نقدم نماذجنا المسبقة هنا. يرجى وضع ControlNet ( ctrlora_sd15_basecn700k.ckpt ) في ./ckpts/ctrlora-basecn و loras في ./ckpts/ctrlora-loras . اتفاقية التسمية لـ LORAs هي ctrlora_sd15_<basecn>_<condition>.ckpt ctrlora_sd15_<basecn>_<condition>_<images>_<steps>.ckpt

تحتاج أيضًا إلى تنزيل النماذج المستندة إلى SD1.5 ووضعها في ./ckpts/sd15 . النماذج المستخدمة في عملنا:

انتشار مستقر v1.5 ( v1-5-pruned.ckpt ): الرسمية / المرآة
رؤية واقعية
Dreamshaper
أنيمي ميسون
الأطفال الهزليين
اللوحة الزيتية
inkpunk
حبر الصيني الهزلي
مزيج القلم الرصاص
Aziib Pixel Mix

Gradio Demo

python app/gradio_ctrlora.py

يتطلب ذاكرة الوصول العشوائي (GPU) على الأقل 9 جيجابايت/21 جيجابايت لإنشاء مجموعة من صور واحدة/أربعة صور 512 × 512.

جيل واحد مشروط

حدد نقطة تفتيش الانتشار المستقرة ، ونقطة تفتيش ControlNet الأساسية ونقطة تفتيش Lora.
كتابة المطالبات والمطالبات السلبية. نحن نقدم العديد من المطالبات شائعة الاستخدام.
قم بإعداد صورة حالة
- قم بتحميل صورة على يسار لوحة "الشرط" ، وحدد المعالج المسبق المقابل لـ Lora ، وانقر فوق "اكتشاف".
- أو قم بتحميل صورة الشرط مباشرةً ، وحدد "None" Preprocessor ، وانقر فوق "اكتشاف".
انقر فوق "تشغيل" لإنشاء الصور.
إذا قمت بتحميل أي نقاط تفتيش جديدة ، فأعد تشغيل Gradio أو انقر فوق "تحديث".

غراد

جيل متعدد المشروط

Gradio2

تطبيق لنقل النمط

حدد نقطة تفتيش انتشار مستقرة منمقة لتحديد النمط الهدف ، على سبيل المثال ، بكسل.
حدد نقطة تفتيش ControlNet الأساسية.
حدد لوحة لنقطة تفتيش LORA1 و LINEART لنقطة تفتيش LORA2.
- Palette + Canny أو Palette + Hed يعمل أيضًا ، ربما توجد مجموعات أكثر إثارة للاهتمام لاكتشافها
كتابة المطالبات والمطالبات السلبية.
قم بتحميل الصورة المصدر إلى لوحة "الشرط 1" ، وحدد "None" Preprocessor ، وانقر فوق "اكتشاف".
قم بتحميل الصورة المصدر إلى لوحة "الشرط 2" ، وحدد "Lineart" preprocessor ، وانقر فوق "اكتشاف".
اضبط أوزان الشرطين في لوحة "الخيارات الأساسية".
انقر فوق "تشغيل" لإنشاء الصور.

Gradio3

تدريب لورا لحالتك المخصصة

استنادًا إلى ControlNet القاعدة لدينا ، يمكنك تدريب Lora لحالتك المخصصة مع ما لا يقل عن 1000 صورة وأقل من ساعة واحدة على وحدة معالجة الرسومات (20 جيجابايت).

أولاً ، قم بتنزيل Diffusion V1.5 ( v1-5-pruned.ckpt ) إلى ./ckpts/sd15 و ControlNet الأساسية ( ctrlora_sd15_basecn700k.ckpt ) إلى ./ckpts/ctrlora-basecn كما هو موضح أعلاه.

ثانياً ، ضع بياناتك المخصصة في ./data/<custom_data_name> مع الهيكل التالي:

 data
└── custom_data_name
    ├── prompt.json
    ├── source
    │   ├── 0000.jpg
    │   ├── 0001.jpg
    │   └── ...
    └── target
        ├── 0000.jpg
        ├── 0001.jpg
        └── ...

يحتوي source على صور الحالة ، مثل حواف Canny ، وخرائط التجزئة ، وصور العمق ، إلخ.
يحتوي target على صور الحقيقة الأرضية المقابلة لصور الشرط.
يجب أن يتبع كل سطر من سطر prompt.json التنسيق مثل {"source": "source/0000.jpg", "target": "target/0000.jpg", "prompt": "The quick brown fox jumps over the lazy dog."} .

ثالثًا ، قم بتشغيل الأمر التالي لتدريب Lora لحالتك المخصصة:

python scripts/train_ctrlora_finetune.py 
    --dataroot ./data/ < custom_data_name > 
    --config ./configs/ctrlora_finetune_sd15_rank128.yaml 
    --sd_ckpt ./ckpts/sd15/v1-5-pruned.ckpt 
    --cn_ckpt ./ckpts/ctrlora-basecn/ctrlora_sd15_basecn700k.ckpt 
    [--name NAME] 
    [--max_steps MAX_STEPS]

--dataroot : مسار إلى البيانات المخصصة.
--name : اسم التجربة. سيكون دليل التسجيل ./runs/name . الافتراضي: الوقت الحالي.
--max_steps : الحد الأقصى لعدد خطوات التدريب. الافتراضي: 100000 .

بعد التدريب ، استخراج أوزان لورا مع الأمر التالي:

python scripts/tool_extract_weights.py -t lora --ckpt CHECKPOINT --save_path SAVE_PATH

--ckpt : المسار إلى نقطة التفتيش التي تنتجها التدريب أعلاه.
--save_path : مسار لحفظ أوزان Lora المستخرجة.

أخيرًا ، ضع Lora المستخرجة في ./ckpts/ctrlora-loras واستخدمها في عرض Gradio.

تعليمات مفصلة

يرجى الرجوع إلى التعليمات هنا للحصول على مزيد من تفاصيل التدريب ، والضبط ، والتقييم.

؟ شكر وتقدير

هذا المشروع مبني على الانتشار المستقر ، ControlNet ، والحيوانات أحادية اللون. شكرا لعملهم العظيم!

انتشار مستقر v1.5: https://github.com/runwayml/stable-diffusion
ControlNet v1.0: https://github.com/lllyasviel/controlnet
ControlNet v1.1: https://github.com/lllyasviel/controlnet-v1-1-nightly
Unicontrol: https://github.com/salesforce/unicontrol

؟ ️ الاقتباس

إذا وجدت هذا المشروع مفيدًا ، فيرجى التفكير في:

 @article { xu2024ctrlora ,
  title = { CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation } ,
  author = { Xu, Yifeng and He, Zhenliang and Shan, Shiguang and Chen, Xilin } ,
  journal = { arXiv preprint arXiv:2410.09400 } ,
  year = { 2024 }
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-02
الحجم 14.26MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل