9 مارس 2025 ، كاليفورنيا ، الولايات المتحدة الأمريكية - يجعل نموذج المصدر المفتوح تكنولوجيا الفيديو Wensheng أكثر إثارة للاهتمام. شارك مطور الذكاء الاصطناعي Ostris (OSTrisai) مؤخرًا نتائج نموذج WAN2.1lora الذي تم تدريبه على منصة X. مع وجود حوالي 20 صورة فقط وبطاقة رسومات RTX4090 المنزلية ، حققت تأثيرات مذهلة لتوليد الفيديو. لا توضح هذه النتيجة إمكانات تكنولوجيا المصادر المفتوحة فحسب ، بل تؤدي أيضًا إلى مناقشة ساخنة في مجتمع X على أدوات التدريب في الفيديو.

تجربة أوستريس مذهلة
عرضت Ostris لأول مرة نتائج التدريب لـ WAN2.114B Lora في منشور 7 مارس. كتب: "يعمل تدريب Lora WAN2.114B بنجاح على 24 جيجابايت! متوسط 1.7 ثانية لكل خطوة بدقة 480 بكسل على 4090." كما شارك مقطع فيديو أولي يوضح جدوى هذا النموذج على الأجهزة المنزلية. ثم في 9 مارس ، أصدر كذلك "فيديو موسيقيًا قصيرًا منخفض التكلفة للمفهوم" ، والذي تم إقرانه مع كلمات قام بإنشائها والموسيقى التي تم إنشاؤها بواسطة sunomusic. تم تدريب الصورة الرقمية في الفيديو على صوره الخاصة.
قال أوسترس إنه استخدم حوالي 20 صورة شخصية فقط ، حيث أكمل العملية باستخدام أداة تدريب الفيديو Lora التي طورها. تنهد في هذا المنصب: "لم أكن أتوقع أن يكون التأثير جيدًا جدًا! لقد استمتعت كثيرًا". لم تتحقق هذه التجربة من الأداء القوي لـ WAN2.1lora فحسب ، بل أظهرت أيضًا إمكانية استخدام المستخدمين العاديين باستخدام أدوات مفتوحة المصدر لتحقيق مقاطع فيديو أدبية عالية الجودة.
أداة التدريب مفتوحة المصدر المشاركة في الفيديو Lora التدريب التي طورتها Ostris أصبحت أبرز ما في هذا الإصدار. UserSundyme تم نشره في 9 مارس: "Video Lora Training موجود هنا ، دعك تصبح بطل الرواية في فيديو AI!" وشركة ASTRIS 'TOOL RINK. تدعم هذه الأداة نموذج WAN2.1 ، مما يسمح للمستخدمين بتدريب نماذج الفيديو المخصصة مع عدد صغير من الصور ، مما يقلل بشكل كبير من العتبة التقنية.
يظهر المستخدمون X اهتمامًا قويًا بهذه الأداة. قال Sundyme: "تدعم أداة التدريب Lora التي طورتها OSTrisai WAN2.1 ولها نتائج مذهلة." تُظهر ملاحظات المجتمع أن التشغيل الفعال للأداة على بطاقات رسومات المستهلكين مثل RTX4090 يتيح لمزيد من المبدعين تجربة توليد فيديو الذكاء الاصطناعي في المنزل.
استجابة المجتمع والأهمية الفنية
يوضح الرد على X أن نتائج Ostris أثارت حماسًا واسع النطاق. علق أحد المستخدمين: "من المذهل تدريب مثل هذا الشخص الرقمي الواقعية مع 20 صورة!" أشاد مستخدم آخر بإمكانات نموذج المصدر المفتوح: "أصبحت مقاطع فيديو Wensheng أكثر إثارة للاهتمام ، ويسمح المصدر المفتوح للأشخاص العاديين باللعب مع الذكاء الاصطناعي."
يعتقد المطلعون على الصناعة أن تجربة Ostris تبرز انفراج نماذج المصادر المفتوحة في مجال توليد الفيديو. يجمع Wan2.1lora بين تقنية التدريب مع بعض العينات ، لا يقلل فقط من متطلبات الأجهزة ، ولكن أيضًا يحسن إمكانية الوصول إلى الخلق المخصص. يفتح هذا النهج مسارات جديدة للمطورين المستقلين والفرق الصغيرة مقارنة بالنماذج التقليدية التي تتطلب مجموعات بيانات كبيرة وخوادم عالية الأداء.
عنوان المشروع: https://github.com/ostris/ai-toolkit