Google은 최근 한 장의 사진을 기반으로 실제와 같은 말하는 동영상을 생성할 수 있는 VLOGGER라는 AI 도구를 출시했습니다. 이 기술은 텍스트 기반 및 오디오 기술을 기반으로 하며 캐릭터 표정 변경, 입 다물기 조정, 기존 비디오 번역 등 고유한 비디오 편집 기능을 제공합니다. Alibaba의 EMO와 비교하여 VLOGGER는 비디오 편집 기능이 뛰어납니다. 현재의 영상 생성 효과는 아직 개선이 필요하지만, AI 영상 생성 분야에서의 혁신적인 시도는 주목할 만하다.
Google은 텍스트 및 구동 오디오 기술을 기반으로 단일 사진에서 인간이 말하는 비디오를 생성하는 도구인 VLOGGER를 출시합니다. 알리바바의 EMO와 비교했을 때 VLOGGER에는 표정 변화, 입 다물기 조절, 번역용 기존 영상 편집 등이 가능한 영상 편집 기능이 있다. VLOGGER는 기술적으로 독특하지만 여전히 동영상 생성 기능을 개선해야 합니다.
VLOGGER의 등장은 AI 영상 생성 기술의 새로운 발전을 의미하며, VLOGGER의 독특한 영상 편집 기능은 사용자에게 더욱 창의적인 가능성을 제공합니다. 앞으로 기술이 계속 발전함에 따라 VLOGGER가 동영상 제작 분야에서 더 큰 역할을 하고 사용자에게 더욱 편리하고 풍부한 동영상 경험을 제공할 수 있다고 믿습니다. 앞으로 더욱 놀라운 비디오 생성 효과를 제공하기 위해 VLOGGER가 더욱 개선되기를 기대합니다.