أصدرت Kuaishou مؤخرًا اختراقًا تكنولوجيًا رئيسيًا ، وفتح رسميًا نموذج توليد الصور المطور بشكل مستقل - "Kotu Kolors". لا يمثل هذا النموذج التراكم العميق لـ Kuaishou في مجال الذكاء الاصطناعي ، ولكنه يوضح أيضًا قوته المبتكرة في تقنية توليد الصور. يمثل إصدار Kotu Kolors اختراقًا مهمًا آخر لـ Kuaishou في تطبيق تقنية الذكاء الاصطناعي ، وخاصة في مجال توليد الصور والمعالجة ، مما يوفر للمبدعين دعمًا قويًا للأدوات.
الميزة الأساسية لـ Kolos هي فهم اللغة القوية وقدرات توليد الصور. يستخدم هذا النموذج نموذج اللغة العامة (GLM) كشرف نص ، يدعم الكلمات السريعة الصينية والإنجليزية ، ويمكنه التعامل مع سياقات تصل إلى 256 رمزًا. هذا يعني أنه يمكن للمستخدمين إنشاء صور تتماشى بشكل كبير مع التوقعات من خلال أوصاف نصية مفصلة ، سواء كانت تصميم مشهد معقد أو تعبير عاطفي دقيق ، يمكن تحقيقه من خلال هذا النموذج.
فيما يتعلق ببيانات التدريب ، تدرب Kolors بشكل عميق على مليارات الصور النصية ، والتي تمنح النموذج قاعدة للمعرفة الغنية وتمكّن توليد الصور المتنوعة والدقيقة. تجدر الإشارة إلى أن النموذج قد تم تحسينه للعناصر الثقافية الصينية.
بالإضافة إلى ذلك ، كان أداء Kotokolors جيدًا بشكل خاص في توليد النص الصيني. لا يمكن أن تفهم فقط الكلمات السريعة الصينية ، ولكن أيضًا تضمين النص الصيني في الصور التي تم إنشاؤها ، مما يضيف قوة أكثر تعبيرية إلى الصورة. تم التحقق من ذلك بالكامل في الاختبار الفعلي.


في التطبيقات العملية ، توضح Koto Kolors قدرتها القوية على توليدها. على سبيل المثال ، عند إنشاء صور على موضوع "الكذب المسطح هريرة" ، يمكن للنموذج تقديم متطلبات الكلمات السريعة الصينية تمامًا ، والنص في الصورة واضح ودقيق. ومع ذلك ، عند استخدام الكلمات المطالبة باللغة الإنجليزية ، يكون أداء النموذج غير كافٍ قليلاً وهو عرضة للكلمات المفقودة أو الأخطاء المطبعية. هذا يدل على أنه على الرغم من أداء Kolos جيدًا في المعالجة الصينية ، إلا أنه لا يزال هناك مجال للتحسين في الجيل الإنجليزي.

خلف Kolors هو الدعم الفني القوي لـ Kuaishou. يعتمد النموذج على بنية SDXL ويتضمن تقنية ChatGLM256 ، مما يزيد من تعزيز قدراتها ثنائية اللغة وقدرات توليد النصوص. ومع ذلك ، تجدر الإشارة إلى أن تشغيل هذا النموذج يتطلب ذاكرة فيديو كبيرة ، حوالي 19 جيجابايت ، مما يضع متطلبات عالية على أجهزة الأجهزة وقد يحد من استخدام بعض المستخدمين.
المصدر المفتوح لـ Kuaishou لـ Kolors هذه المرة ليس مجرد مساهمة في مجتمع التكنولوجيا ، ولكن أيضًا ترويجًا جريئًا للحرية الإبداعية. من خلال المصدر المفتوح ، يأمل Kuaishou أن يتمكن المزيد من المطورين والمصممين والفنانين من استخدام هذه الأداة لاستكشاف الاحتمالات اللانهائية لمنظمة العفو الدولية في الخلق الفني. في الوقت نفسه ، يوضح هذا أيضًا تصميم Kuaishou وقوته في مجال تكنولوجيا الذكاء الاصطناعى ، مما يشير إلى أنه سيتم تطبيق المزيد من التقنيات المبتكرة على السيناريوهات الفعلية في المستقبل.
تتضمن خطة Koto Kolors Open Source أيضًا دعم CN (ControlNet) ، و Lora (التكيف المنخفض) ، و IPA (تكيف الصور) ودعم Comfyui المباشر. العملية.
بشكل عام ، لا يمثل إصدار Kotu Kolors مجرد اختراق مهم لكويشو في مجال تكنولوجيا الذكاء الاصطناعي ، ولكن أيضًا ابتكار في تقنية توليد الصور. من خلال إمكانياتها القوية لفهم اللغة وقدرات توليد الصور ، يوفر للمستخدمين أدوات إبداعية جديدة ، كما أنه يفتح مسارًا جديدًا لتطبيق تقنية الذكاء الاصطناعى في الإنشاء الفني.
موقع Ketu الرسمي: https://top.aibase.com/tool/kuaishouketudamoxingkolors
عنوان المشروع: https://top.aibase.com/tool/kolors