최근 Alibaba는 밤 늦게 새로운 오픈 소스 비디오 생성 모델 WAN2.1을 출시했습니다. 이 모델은 14b 매개 변수 볼륨으로 vbench 목록을 신속하게 차지하고 비디오 생성 분야의 현재 리더가되었습니다. 이전에 출시 된 QWQ-Max와 비교할 때 WAN2.1은 복잡한 움직임의 세부 사항에서 특히 잘 수행되며 여러 캐릭터의 동기 춤을 부드럽게 실현하여 강력한 기술적 강점을 보여줍니다.
공식 시연에서 WAN2.1은 정적 이미지 생성의 어려움을 성공적으로 해결했을뿐만 아니라 새로운 수준의 워드 프로세싱에 도달했습니다. 개인 소비자 그래픽 카드에 14B 매개 변수를 배포하는 데 어려움이 있지만 Alibaba는 480p 해상도를 지원하고 12GB 그래픽 메모리가 장착 된 4070 그래픽 카드를 사용하여 원활하게 실행할 수있는 작은 버전의 1.3B를 특별히 시작하여 일반 사용자에게 더 많은 선택을 제공 할 수 있습니다.

Alibaba는 버전 14B 및 1.3B 외에도 APACHE2.0 프로토콜을 사용하여 사용자가 무료로 사용할 수있는 두 가지 추가 비디오 생성 모델도 출시했습니다. 사용자는 알리바바에서 제공 한 플랫폼을 통해이 모델에 액세스하여 비디오를 신속하게 생성 할 수 있습니다. 그러나 사용자 볼륨의 급증으로 인해 대기 시간이 너무 길어질 수 있습니다. 특정 기술 기반을 가진 사용자의 경우 Huggingface 및 Modai 커뮤니티와 같은 다양한 채널을 통해 스스로 설치하고 디버깅 할 수 있습니다.
WAN2.1의 가장 큰 하이라이트는 기술 혁신입니다. 이 모델은 확산 변압기 아키텍처를 채택하고 3D 변형 자동 인코더를 결합하여 비디오 생성을 위해 특별히 설계합니다. 다양한 압축 및 병렬 전략을 도입 함으로써이 모델은 품질을 보장하면서 생성 효율성을 크게 향상시킵니다. 연구에 따르면 WAN의 재건 속도는 현재 유사한 기술의 2.5 배이며 컴퓨팅 리소스를 크게 절약 할 수 있습니다.
사용자 경험 측면에서 WAN2.1은 광범위한 칭찬을 받았습니다. 역동적 인 장면이나 자연스러운 물리적 효과에서 세부 사항을 생성하든 모델의 성능은 인상적입니다. 이 모델을 통해 사용자는 고품질 비디오 작업을 생성 할뿐만 아니라 동적 텍스트 프리젠 테이션을 쉽게 실현하여 자신의 창작에 더 많은 가능성을 가져옵니다.
Alibaba의 WAN2.1 모델은 기술적으로 진보 될뿐만 아니라 제작자에게보다 창의적인 자유를 제공하여 비디오 생성 기술의 또 다른 주요 획기적인 획기적인 것을 나타냅니다. 이 모델의 출시는 의심 할 여지없이 비디오 생성 분야의 개발을 촉진하고 사용자에게보다 혁신적인 경험을 제공 할 것입니다.