เมื่อเร็ว ๆ นี้อาลีบาบาประกาศว่ารุ่นการสร้างวิดีโอ WANX2.1 จะเป็นโอเพ่นซอร์สอย่างเต็มที่และประกาศเอฟเฟกต์วิดีโอล่าสุด ข่าวนี้ได้รับความสนใจอย่างกว้างขวางในชุมชนเทคโนโลยีซึ่งเป็นอีกหนึ่งความก้าวหน้าครั้งสำคัญในเทคโนโลยี AI ในด้านการสร้างวิดีโอ
ในเดือนมกราคม 2568 ทีม Tongyi Wanxiang ของอาลีบาบาได้เปิดตัวรุ่น Wanx2.1 Multimodal ด้วยประสิทธิภาพที่โดดเด่นในด้านการสร้างวิดีโอโมเดลได้เพิ่มรายการรีวิว VBench ซึ่งกำหนดมาตรฐานการสร้างภาพที่ขับเคลื่อนด้วย AI ทีม Wanx ประกาศเมื่อคืนที่ผ่านมาว่าจะเปิดแหล่งข้อมูลการสร้างวิดีโอ WANX2.1 ล่าสุดซึ่งจะส่งเสริมการเพิ่มความนิยมและการประยุกต์ใช้เทคโนโลยี AI อย่างไม่ต้องสงสัย
มีรายงานว่า WANX2.1 เอาชนะปัญหาการสร้างข้อความที่ยาวนานในโมเดลวิดีโอ AI เป็นครั้งแรกกลายเป็นรุ่นแรกของโลกเพื่อสนับสนุนเอฟเฟกต์ข้อความพิเศษภาษาจีนและภาษาอังกฤษ ผู้ใช้จะต้องป้อนคำแนะนำข้อความเพื่อสร้างวิดีโอแบบไดนามิกและจับคู่กับการเปลี่ยนแปลงที่หลากหลายอนุภาคและเอฟเฟกต์พิเศษอื่น ๆ นอกจากนี้ด้วย VAE ที่มีประสิทธิภาพและสถาปัตยกรรม DIT ที่พัฒนาขึ้นเองแบบจำลองตระหนักถึงการเข้ารหัสที่มีประสิทธิภาพและการถอดรหัสวิดีโอ 1080p ที่มีความยาวอย่างไม่สิ้นสุดซึ่งเป็นการปรับปรุงความสามารถในการสร้างแบบจำลองบริบทเชิงพื้นที่และทางโลกอย่างมีนัยสำคัญ
ในแง่ของการจำลองกฎหมายทางกายภาพ WANX2.1 สามารถฟื้นฟูสถานการณ์ที่ซับซ้อนได้อย่างถูกต้องเช่นการชนการรีบาวด์และการตัด ตัวอย่างเช่นเมื่อสร้างวิดีโอของ "เม็ดฝนที่ตกลงมาบนพื้นผิวร่มและน้ำสาด" หรือ "สเก็ตรูปปั่น" การประสานงานทางกายภาพและวิถีการเคลื่อนไหวนั้นสอดคล้องกับกฎทางกายภาพที่แท้จริง ความก้าวหน้าทางเทคโนโลยีนี้นำประสบการณ์การมองเห็นที่สมจริงและราบรื่นมาสู่การสร้างวิดีโอ AI