في الآونة الأخيرة ، أصدرت Alibaba طراز Video Video الجديد مفتوح المصدر WAN2.1 في وقت متأخر من الليل. وتصدر هذا النموذج بسرعة قائمة VBench مع حجم المعلمة 14B وأصبح الرائد الحالي في مجال توليد الفيديو. مقارنةً بـ QWQ-Max الذي تم إصداره مسبقًا ، يعمل Wan2.1 جيدًا بشكل خاص في تفاصيل الحركات المعقدة ، ويمكن أن يدرك بشكل سلس الرقص المتزامن لشخصيات متعددة ، مما يدل على قوته التقنية القوية.
في المظاهرة الرسمية ، لم يحل WAN2.1 بنجاح الصعوبات في توليد الصور الثابتة فحسب ، بل وصل أيضًا إلى مستوى جديد في معالجة النصوص. على الرغم من وجود بعض الصعوبات في نشر معلمات 14B على بطاقات رسومات المستهلك الشخصية ، إلا أن Alibaba أطلقت بشكل خاص إصدارًا صغيرًا من 1.3B ، والذي يدعم دقة 480 بكسل ويمكن أن يعمل بسلاسة باستخدام بطاقة رسومات 4070 مع ذاكرة رسومات 12 جيجابايت ، مما يوفر المزيد من الخيارات للمستخدمين العاديين.

بالإضافة إلى الإصدارات 14B و 1.3B ، أصدرت Alibaba أيضًا طرازين إضافيين لتوليد الفيديو ، كلاهما باستخدام بروتوكول Apache2.0 ، والذي يمكن للمستخدمين استخدامه مجانًا. يمكن للمستخدمين الوصول إلى هذا النموذج من خلال النظام الأساسي الذي توفره Alibaba لإنشاء مقاطع فيديو بسرعة. ومع ذلك ، نظرًا لارتفاع مستوى مستوى المستخدم ، قد تكون هناك حالات يكون فيها وقت الانتظار طويلًا جدًا. بالنسبة للمستخدمين الذين لديهم أساس تقني معين ، يمكنهم أيضًا تثبيت وتصحيحهم بمفردهم من خلال قنوات مختلفة مثل Huggingface و Modai Community.
أبرز ما في WAN2.1 هو ابتكارها التكنولوجي. يتبنى النموذج بنية محول الانتشار ويجمع بين مشفر تلقائي ثلاثي الأبعاد للتصميم خصيصًا لتوليد الفيديو. من خلال إدخال مجموعة متنوعة من الضغط والاستراتيجيات المتوازية ، يحسن النموذج بشكل كبير كفاءة التوليد مع ضمان الجودة. تشير الأبحاث إلى أن سرعة إعادة بناء WAN هي 2.5 ضعف سرعة التقنيات المشابهة الحالية ، مما يوفر بشكل كبير موارد الحوسبة.
فيما يتعلق بتجربة المستخدم ، تلقى WAN2.1 أيضًا مدحًا واسع النطاق. سواء كان ذلك يولد تفاصيل في المشاهد الديناميكية أو التأثيرات المادية الطبيعية ، فإن أداء النموذج مثير للإعجاب. من خلال هذا النموذج ، لا يمكن للمستخدمين إنتاج أعمال فيديو عالية الجودة فحسب ، بل يمكنهم أيضًا تحقيق عرض ديناميكي للنص بسهولة ، مما يجعل المزيد من الاحتمالات لإنشاءهم.
نموذج WAN2.1 من Alibaba ليس متقدمًا تقنيًا فحسب ، بل يوفر أيضًا المزيد من الحرية الإبداعية للمبدعين ، مما يمثل اختراقًا كبيرًا آخر في تقنية توليد الفيديو. سيؤدي إصدار هذا النموذج بلا شك إلى زيادة تشجيع تطوير مجال توليد الفيديو وتجلب تجارب أكثر ابتكارًا للمستخدمين.