Shengshu Technology의 비디오 생성 모델 Vidu 버전 1.5는 "다주제 일관성" 문제를 극복하기 위해 출시되었습니다.

저자：Eve Cole 업데이트 시간：2025-03-06 16:00:04

Vidu가 온라인에 접속한 지 100여 일이 지난 후 Shengshu Technology는 Vidu 버전 1.5를 출시했습니다. 이 버전은 다양한 입력을 이해하고 "일관성" 문제를 해결하는 데 있어 세계 최고의 혁신을 이루었습니다. Downcodes의 편집자는 Vidu 1.5가 가져온 혁신과 Vidu 1.5가 어떻게 시각적 모델을 촉진하여 "컨텍스트" 시대로 이동하고 일반 인공 지능(AGI)의 도래를 가속화하는지에 대한 심층적인 이해를 제공합니다.

Vidu가 온라인에 접속한 지 100일이 넘은 것을 계기로 Shengshu Technology는 특히 다양한 입력을 이해하고 "일관성"을 돌파하는 분야에서 세계 최고의 혁신을 달성한 Vidu 1.5의 새 버전 출시를 발표하게 된 것을 자랑스럽게 생각합니다. 문제.

Vidu1.5의 출시는 시각적 모델이 새로운 "컨텍스트" 시대로 진입하는 것을 의미하며 일반 인공 지능(AGI)의 도래를 가속화합니다. Vidu는 글로벌 출시 이후 일관된 캐릭터를 생성하는 능력을 갖추고 있으며, 캐릭터의 얼굴 특징을 고정하여 비디오 생성의 주요 문제점을 해결합니다. 지난 9월 비두는 '주체 일관성' 기능을 세계 최초로 출시해 얼굴 일관성을 전신 일관성까지 확장하고, 동물, 사물, 가상 캐릭터 등 모든 피사체로 범위를 확장했다. Vidu의 기술적 혁신은 주로 복잡한 피사체의 정밀한 제어, 얼굴 특징의 자연스러운 일관성 및 캐릭터의 역동적인 표현, 다중 피사체의 일관성이라는 세 가지 측면에 반영됩니다.

Vidu1.5는 시각적 모델의 새로운 "지능형 출현"과 강력한 상황별 학습 기능을 보여줍니다. 이는 시각적 모델이 이해하고 상상하는 능력뿐만 아니라 생성 과정에서 메모리 관리도 수행할 수 있음을 의미합니다. Vidu1.5는 업계 최고의 생성 효율성을 유지하며 30초 이내에 비디오를 생성할 수 있습니다. Vidu는 다재다능함의 개념과 LLM(Large Language Model)과 일치하는 디자인 철학을 고수하여 모든 문제를 시각적 입력 및 시각적 출력 문제로 통합하고 단일 Transformer를 사용하여 가변 길이 입력 및 출력을 균일하게 모델링하고 비디오 데이터로부터 압축 지능.

Vidu1.5의 출시는 비디오 모델의 제어 가능성을 향상시킬 뿐만 아니라 유연한 다중 입력을 통해 다중 각도, 다중 주제 및 다중 요소의 일관된 생성을 달성합니다. 이는 시각 지능의 출현을 의미하며 AGI의 도래를 가속화합니다. Vidu는 더 이상 고품질의 효율적인 비디오 생성기가 아니라 상황에 맞는 정보와 메모리를 생성 프로세스에 통합할 수도 있습니다. 이는 시각적 모달 지능의 "큰 도약"입니다. 시각적 모델은 더 강력한 인지 능력을 갖고 AGI 퍼즐의 중요한 부분이 될 것입니다.

체험주소 : www.vidu.studio

Vidu 버전 1.5의 출시는 시각적 AI 기술의 새로운 장을 열었습니다. 강력한 기능과 편리한 작동으로 사용자에게 새로운 비디오 생성 경험을 선사할 것입니다. 우리는 Vidu가 향후 개발에서 계속해서 획기적인 발전을 이루고 AGI의 도래에 더 많은 기여를 하기를 기대합니다!