최근 Alibaba는 비디오 생성 모델 WANX2.1이 완전히 오픈 소스가 될 것이며 최신 비디오 효과를 발표했다고 발표했습니다. 이 뉴스는 기술 커뮤니티에서 광범위한 관심을 끌었으며 비디오 생성 분야의 AI 기술의 또 다른 주요 획기적인 획기적인 정보를 표시했습니다.
2025 년 1 월, Alibaba의 Tongyi Wanxiang 팀은 WANX2.1 멀티 모달 모델을 시작했습니다. 비디오 생성 분야에서 뛰어난 성능을 발휘 하여이 모델은 Vbench 검토 목록을 1 위, AI 중심 시각적 생성 표준을 재정의했습니다. WANX 팀은 지난 밤에 최신 WANX2.1 비디오 세대 모델을 오픈 소스로 발표했으며, 이는 의심 할 여지없이 AI 기술의 추가 대중화 및 적용을 촉진 할 것입니다.
WANX2.1은 AI 비디오 모델의 오랜 텍스트 생성 문제를 처음으로 극복하여 중국 및 영어 텍스트 특수 효과를 지원하는 세계 최초의 모델이되었습니다. 사용자는 동적 비디오를 생성하고 다양한 전환, 입자 및 기타 특수 효과와 일치시키기 위해 텍스트 지침 만 입력하면됩니다. 또한, 자체 개발 효율적인 VAE 및 DIT 아키텍처를 통해이 모델은 활발한 1080p 비디오의 효율적인 인코딩 및 디코딩을 실현하여 공간 및 시간적 컨텍스트 모델링 기능을 크게 향상시킵니다.
물리 법칙 시뮬레이션 측면에서 WANX2.1은 충돌, 리바운드 및 절단과 같은 복잡한 시나리오를 정확하게 복원 할 수 있습니다. 예를 들어, "우산 표면에 떨어지고 물이 튀는 물"또는 "피겨 스케이터 회전"의 비디오를 생성 할 때, 물리적 조정 및 운동 궤적은 실제 물리 법칙과 일치하여 전통적인 모델의 물리적 왜곡과 뻣뻣한 움직임의 문제를 효과적으로 해결합니다. 이 기술 혁신은 AI 비디오 생성에보다 현실적이고 부드러운 시각적 경험을 제공합니다.