مدرب
تم تطوير هذا المدرب من قبل فريق عدن ، يمكنك تجربة نسختنا المستضافة من المدرب في تطبيقنا . إنه مدرب محسّن للغاية يمكن استخدامه لكل من وحدات Lora الكاملة للتدريب وتدريب على قمة الانتشار المستقر. ويستخدم برنامج نصي واحد تدريب وخسارة يعمل لكل من SDV15 و SDXL !
مخرجات هذا المدرب متوافقة تمامًا مع Comfyui و Auto111 ، انظر الوثائق هنا. يمكن العثور على دليل كامل للتدريب في مستنداتنا .
صور التدريب:

IMGs المولدة مع لورا المدربة:

يمكن تشغيل المدرب بـ 4 طرق مختلفة:
- كخدمة مستضافة على موقعنا
- كخدمة مستضافة من خلال النسخ المتماثل
- كعقدة comfyui
- كنص من ثعبان مستقل
باستخدام في comfyui:
- مثال على سير العمل حول كيفية تشغيل المدرب والقيام بالاستدلال معه يمكن العثور عليه في
/ComfyUI_workflows - الأهم من ذلك أن هذا المدرب يستخدم مكالمة chatgpt لتنظيف المطالبات التي تم إنشاؤها تلقائيًا وحقن الرمز المميز القابل للتدريب ، لن يعمل هذا إلا إذا كان لديك ملف .env يحتوي على مفتاح Openai الخاص بك في جذر repo dir الذي يحتوي على سطر واحد:
OPENAI_API_KEY=your_key_string do this ، ولكن النتائج ستكون أفضل إذا قمت بتعيين هذا الأمر ، وخاصة ".
يدعم المدرب 3 أوضاع افتراضية:
- النمط : يستخدم لتعلم النمط الجمالي لمجموعة من الصور.
- الوجه : يستخدم لتعلم وجه معين (يمكن أن يكون إنسانًا ، شخصية ، ...).
- الكائن : سوف يتعلم كائنًا أو شيءًا محددًا في صور التدريب.
مثال على التدريب على النمط:

يثبت
تثبيت جميع التبعيات باستخدام
pip install -r requirements.txt
ثم يمكنك ببساطة الجري:
python main.py train_configs/training_args.json لبدء وظيفة التدريب.
اضبط الحجج داخل training_args.json لإعداد وظيفة تدريب مخصصة.
يمكنك أيضًا تشغيل هذا من خلال النسخ المتماثل باستخدام COG (~ صورة Docker):
- تثبيت النسخ المتماثل "COG":
sudo curl -o /usr/local/bin/cog -L "https://github.com/replicate/cog/releases/latest/download/cog_$(uname -s)_$(uname -m)"
sudo chmod +x /usr/local/bin/cog
- قم ببناء الصورة باستخدام
cog build - قم بتشغيل التدريب مع
sh cog_test_train.sh - يمكنك أيضًا الذهاب إلى الحاوية مع
cog run /bin/bash
الكامل unet finetuning
عند تشغيل هذا المدرب في Python الأصلي ، يمكنك أيضًا إجراء Finetuning Unet الكامل باستخدام شيء مثل (التكيف مع احتياجاتك) python main.py train_configs/full_finetuning_example.json
تودو
الأخطاء:
- لا يبدو أن الانعكاس النصي الخالص لـ SD15 يعمل بشكل جيد ... (لكنه يعمل بشكل جيد بشكل مثير للدهشة لـ SDXL ...) ---> إذا كان بإمكان أي شخص معرفة ذلك ، فسأكون ممتنًا إلى الأبد!
- اكتشف لماذا التدريب أبطأ 3x من خلال عقدة comfyui مقابل مجرد تشغيل main.py كوظيفة python ..؟
- Fix Side_ratio bucketing في dataloader (انظر https://github.com/kohya-ss/sd-scripts)
تحسينات أكبر:
- دمج Flux / SD3
- أضف تدريبًا متعدد المفاهيم (أشياء متعددة ممثلة برموز متعددة ، تم تدريبها على لورا واحدة)
- أضف تنظيم رمز أقوى (مثل Celebbasis تمتد على أساس)
- تنفيذ أفكار نضح (قفل مفتاح مع فائقة): https://research.nvidia.com/labs/par/perfusion/
- تنفيذ المطالبة: https://prompt-aligned.github.io/