Kürzlich kündigte Alibaba an, dass sein Videogenerierungsmodell WANX2.1 vollständig Open Source sein wird, und kündigte die neuesten Videoeffekte an. Diese Nachricht hat in der Technologiegemeinschaft weit verbreitete Aufmerksamkeit erregt und einen weiteren großen Durchbruch in der AI -Technologie im Bereich der Videogenerierung markiert.
Im Januar 2025 startete Alibabas Tongyi Wanxiang -Team das multimodale Modell von Wanx2.1. Mit seiner herausragenden Leistung im Bereich der Videogenerierung stellte das Modell die VBench Review-Liste an und definierte kI-gesteuerte visuelle Erstellungsstandards. Das Wanx -Team gab gestern Abend bekannt, dass es sein neuestes WANX2.1 -Videogenerierungsmodell eröffnen wird, das zweifellos die weitere Popularisierung und Anwendung der AI -Technologie fördern wird.
Es wird berichtet, dass WANX2.1 zum ersten Mal das langjährige Problem der Textgenerierung in KI-Videomodellen überwindet und das weltweit erste Modell für die Unterstützung chinesischer und englischer Textspezialeffekte wird. Benutzer müssen nur Textanweisungen eingeben, um dynamische Videos zu generieren und sie mit verschiedenen Übergängen, Partikeln und anderen Spezialeffekten abzustimmen. Darüber hinaus realisiert das Modell durch selbst entwickelte effiziente VAE- und DIT-Architekturen eine effiziente Codierung und Dekodierung von unendlich langen 1080p-Videos, wodurch die räumlichen und zeitlichen Kontextmodellierungsfunktionen erheblich verbessert werden.
In Bezug auf die Simulation des physischen Rechts kann Wanx2.1 komplexe Szenarien wie Kollision, Abpraller und Schneiden genau wiederherstellen. Wenn Sie beispielsweise Videos von "Regentropfen auf die Dachoberfläche und das Spritzen von Wasser" oder "Figuren -Skater drehen" erzeugen, entsprechen die physische Koordination und Bewegungsbahn mit realen physischen Gesetzen und lösen die Probleme der physischen Verzerrung und steifer Bewegungen traditioneller Modelle effektiv. Dieser technologische Durchbruch verleiht der KI -Videogenerierung ein realistischeres und rotes visuelleres Erlebnis.