Model generasi video open source Alibaba WAN 2.1 online dan dapat berjalan dengan lancar - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-05-17 03:25:01

Baru -baru ini, Alibaba merilis model generasi video open source baru WAN2.1 larut malam. Model ini dengan cepat menduduki puncak daftar VBench dengan volume parameter 14B dan menjadi pemimpin saat ini di bidang pembuatan video. Dibandingkan dengan QWQ-Max yang sebelumnya dirilis, WAN2.1 berkinerja sangat baik dalam detail gerakan kompleks, dan dapat dengan lancar mewujudkan tarian sinkron dari berbagai karakter, menunjukkan kekuatan teknisnya yang kuat.

Dalam demonstrasi resmi, WAN2.1 tidak hanya berhasil memecahkan kesulitan dalam pembuatan gambar statis, tetapi juga mencapai tingkat baru dalam pemrosesan kata. Meskipun ada kesulitan tertentu dalam menyebarkan parameter 14B pada kartu grafis konsumen pribadi, Alibaba telah secara khusus meluncurkan versi kecil 1.3B, yang mendukung resolusi 480p dan dapat berjalan dengan lancar menggunakan kartu grafis 4070 dengan memori grafis 12GB, memberikan lebih banyak pilihan untuk pengguna biasa.

大脑大模型

Selain versi 14b dan 1.3B, Alibaba juga telah merilis dua model pembuatan video tambahan, keduanya menggunakan protokol APACHE2.0, yang dapat digunakan pengguna secara gratis. Pengguna dapat mengakses model ini melalui platform yang disediakan oleh Alibaba untuk dengan cepat menghasilkan video. Namun, karena lonjakan volume pengguna, mungkin ada kasus di mana waktu tunggu terlalu lama. Untuk pengguna dengan fondasi teknis tertentu, mereka juga dapat menginstal dan men -debug sendiri melalui berbagai saluran seperti Huggingface dan Modai Community.

Sorotan terbesar dari WAN2.1 adalah inovasi teknologinya. Model ini mengadopsi arsitektur transformator difusi dan menggabungkan autoencoder variasional 3D untuk merancang khusus untuk pembuatan video. Dengan memperkenalkan berbagai strategi kompresi dan paralel, model ini sangat meningkatkan efisiensi generasi sambil memastikan kualitas. Penelitian menunjukkan bahwa kecepatan rekonstruksi WAN adalah 2,5 kali lipat dari teknologi serupa saat ini, yang secara signifikan menghemat sumber daya komputasi.

Dalam hal pengalaman pengguna, WAN2.1 juga telah menerima pujian luas. Apakah itu menghasilkan detail dalam adegan dinamis atau efek fisik alami, kinerja model sangat mengesankan. Melalui model ini, pengguna tidak hanya dapat menghasilkan karya video berkualitas tinggi, tetapi juga dengan mudah mewujudkan presentasi teks yang dinamis, membawa lebih banyak kemungkinan untuk penciptaan mereka.

Model WAN2.1 Alibaba tidak hanya maju secara teknologi, tetapi juga memberikan kebebasan kreatif yang lebih kreatif bagi pencipta, menandai terobosan besar lainnya dalam teknologi pembuatan video. Rilis model ini tidak diragukan lagi akan lebih mempromosikan pengembangan bidang generasi video dan membawa pengalaman yang lebih inovatif bagi pengguna.