تم إصدار نموذج إنشاء الفيديو الخاص بشركة Shengshu Technology Vidu الإصدار 1.5 للتغلب على مشكلة "التناسق متعدد الموضوعات"

الكاتب：Eve Cole وقت التحديث：2025-03-06 16:00:04

بعد أكثر من مائة يوم من ظهور Vidu على الإنترنت، أطلقت Shengshu Technology بشكل رائع الإصدار 1.5 من Vidu. وقد حقق هذا الإصدار اختراقات رائدة عالميًا في فهم المدخلات المتنوعة وحل مشكلات "الاتساق". سيمنحك محرر Downcodes فهمًا متعمقًا للابتكارات التي جلبها Vidu 1.5 وكيف يروج للنموذج المرئي للانتقال إلى عصر "السياق" وتسريع وصول الذكاء الاصطناعي العام (AGI).

بمناسبة بقاء Vidu على الإنترنت لأكثر من 100 يوم، تفخر شركة Shengshu Technology بالإعلان عن إصدار الإصدار الجديد من Vidu 1.5، الذي حقق اختراقات رائدة عالميًا، خاصة في فهم المدخلات المتنوعة واختراق "الاتساق" مشكلة.

يمثل إطلاق Vidu1.5 النموذج المرئي الذي يدخل عصر "السياق" الجديد، مما يسرع وصول الذكاء الاصطناعي العام (AGI). يتمتع Vidu بالقدرة على إنشاء شخصيات متسقة منذ إطلاقه عالميًا، ويحل نقاط الضعف الرئيسية في إنشاء الفيديو عن طريق قفل ملامح وجه الشخصيات. في سبتمبر، كان Vidu هو الأول في العالم الذي أطلق وظيفة "تناسق الموضوع"، مما أدى إلى توسيع تناسق الوجه إلى تناسق الجسم بالكامل، وتوسيع النطاق ليشمل أي موضوع مثل الحيوانات والأشياء والشخصيات الافتراضية. تنعكس إنجازات Vidu التكنولوجية بشكل أساسي في ثلاثة جوانب: التحكم الدقيق في الموضوعات المعقدة، والاتساق الطبيعي لملامح الوجه والتعبيرات الديناميكية للشخصيات، والاتساق متعدد الموضوعات.

يوضح Vidu1.5 "الظهور الذكي" الجديد للنموذج المرئي وقدراته القوية على التعلم السياقي. وهذا يعني أن النموذج المرئي ليس لديه القدرة على الفهم والتخيل فحسب، بل يمكنه أيضًا إدارة الذاكرة أثناء عملية الإنشاء. يواصل Vidu1.5 كفاءة التوليد الرائدة في الصناعة ويمكنه إنشاء مقطع فيديو في أقل من 30 ثانية. تلتزم Vidu بمفهوم التنوع وفلسفة التصميم المتوافقة مع LLM (نموذج اللغة الكبير)، وتوحيد جميع المشكلات في مشكلات الإدخال المرئي والإخراج المرئي، باستخدام محول واحد لنموذج موحد للإدخال والإخراج المتغير الطول، ومن الحصول على بيانات الفيديو الذكاء في الضغط.

لا يؤدي إطلاق Vidu1.5 إلى تحسين إمكانية التحكم في نماذج الفيديو فحسب، بل يحقق أيضًا توليدًا متسقًا لزوايا متعددة وموضوعات متعددة وعناصر متعددة من خلال مدخلات متعددة مرنة. وهذا يمثل ظهور الذكاء البصري ويسرع وصول الذكاء الاصطناعي العام. لم يعد Vidu مجرد مولد فيديو عالي الجودة وفعال، بل يمكنه أيضًا دمج المعلومات السياقية والذاكرة في عملية الإنشاء، وهذه "قفزة كبيرة" في الذكاء البصري. سيكون للنموذج المرئي قدرات معرفية أقوى وسيصبح جزءًا مهمًا من لغز الذكاء الاصطناعي العام.

عنوان التجربة: www.vidu.studio

يبشر إصدار الإصدار 1.5 من Vidu بفصل جديد في تقنية الذكاء الاصطناعي المرئي. من المؤكد أن وظائفها القوية وتشغيلها المريح ستوفر للمستخدمين تجربة جديدة لتوليد الفيديو. نحن نتطلع إلى استمرار Vidu في تحقيق اختراقات في التطوير المستقبلي والمساهمة بشكل أكبر في وصول AGI!