Kürzlich veröffentlichte Alibaba das neue Open -Source -Videogenerierungsmodell Wan2.1 spät in der Nacht. Dieses Modell führte die VBench -Liste schnell mit seinem 14B -Parametervolumen an und wurde zum aktuellen Anführer im Bereich der Videogenerierung. Im Vergleich zu dem zuvor veröffentlichten QWQ-Max spielt WAN2.1 besonders gut in den Details komplexer Bewegungen und kann den synchronen Tanz mehrerer Charaktere reibungslos erkennen, was seine starke technische Stärke demonstriert.
In der offiziellen Demonstration löste Wan2.1 nicht nur die Schwierigkeiten bei der statischen Bildgenerierung erfolgreich, sondern erreichte auch eine neue Niveau in der Textverarbeitung. Obwohl es bestimmte Schwierigkeiten bei der Bereitstellung der 14B -Parameter für persönliche Verbrauchergrafikkarten gibt, hat Alibaba speziell eine kleine Version von 1,3B gestartet, die eine Auflösung von 480p unterstützt und mit einer 4070 -Grafikkarte mit 12 -GB -Grafikspeicher reibungsloser ausgeführt wird.

Zusätzlich zu den Versionen 14B und 1,3B hat Alibaba zwei zusätzliche Videogenerierungsmodelle veröffentlicht, die beide das Apache2.0 -Protokoll verwenden, das Benutzer kostenlos verwenden können. Benutzer können über die von Alibaba bereitgestellte Plattform auf dieses Modell zugreifen, um schnell Videos zu generieren. Aufgrund des Anstiegs des Benutzervolumens kann es jedoch Fälle geben, in denen die Wartezeit zu lang ist. Für Benutzer mit einer bestimmten technischen Grundlage können sie sie auch selbst über verschiedene Kanäle wie Huggingface und Modai Community installieren und debuggen.
Der größte Höhepunkt von WAN2.1 ist seine technologische Innovation. Das Modell übernimmt die Diffusionstransformatorarchitektur und kombiniert einen 3D -Variations -Autocoder, um speziell für die Videogenerierung zu entwerfen. Durch die Einführung einer Vielzahl von Komprimierungs- und Parallelstrategien verbessert das Modell die Erzeugungseffizienz erheblich und gewährleistet die Qualität. Untersuchungen zeigen, dass die Rekonstruktionsgeschwindigkeit von WAN das 2,5 -fache der aktuellen ähnlichen Technologien beträgt, was die Rechenressourcen erheblich spart.
In Bezug auf die Benutzererfahrung hat WAN2.1 auch weit verbreitetes Lob erhalten. Egal, ob es sich um Details in dynamischen Szenen oder natürlichen physikalischen Effekten handelt, die Leistung des Modells ist beeindruckend. Durch dieses Modell können Benutzer nicht nur qualitativ hochwertige Videowerke produzieren, sondern auch die dynamische Darstellung von Text problemlos realisieren und mehr Möglichkeiten für ihre Erstellung bringen.
Das WAN2.1 -Modell von Alibaba ist nicht nur technologisch fortschrittlich, sondern bietet auch kreativere Freiheit für die Schöpfer und ist ein weiterer großer Durchbruch in der Videogenerationstechnologie. Die Veröffentlichung dieses Modells wird zweifellos die Entwicklung des Bereichs der Videogenerierung weiter fördern und den Benutzern innovativere Erlebnisse bringen.