최근 DeepBeepMeep 팀은 저가형 GPU 사용자를 위해 최적화 된 비디오 생성 모델 인 GitHub에서 WAN2.1GP를 출시했습니다. 알리바바의 WAN2.1을 기반으로 한이 모델은 고성능 GPU 리소스가 부족한 사용자에게 강력한 비디오 생성 기능을 제공하도록 설계되었습니다. WAN2.1GP의 출시는 비디오 생성 기술, 특히 오픈 소스 필드에서 중요한 발전을 보여줍니다.
WAN2.1GP의 주요 기능에는 탁월한 성능과 광범위한 적용 가능성이 포함됩니다. 이 모델은 기존 오픈 소스 모델과 여러 벤치 마크에서 일부 상용 솔루션을 계속 능가하여 강력한 경쟁력을 보여줍니다. 또한 T2V-1.3B 모델은 8.19GB의 비디오 메모리 만 필요하므로 거의 모든 소비자 등급 GPU가 실행됩니다. RTX4090 그래픽 카드를 사용하면 약 4 분 안에 5 초 480p 비디오를 생성 할 수 있으며 성능은 일부 폐쇄 소스 모델과 비슷합니다.
WAN2.1GP는 비디오에 대한 텍스트, 이미지에서 비디오, 비디오 편집 및 기타 작업을 지원할뿐만 아니라 동시에 중국어와 영어 텍스트를 생성 할 수있는 최초의 비디오 모델이기도합니다. 이 기능은 사용자의 실제 응용 프로그램에 더 많은 가능성을 제공합니다. 또한이 모델에는 강력한 비디오 변형 자동 인코더 (VAE)가 장착되어있어 모든 길이의 1080p 비디오를 효율적으로 인코딩하고 디코딩하여 시간 정보를 그대로 유지하여 비디오 및 이미지 생성을위한 견고한 기초를 놓을 수 있습니다.
사용자 경험을 향상시키기 위해 WAN2.1GP는 메모리 및 비디오 메모리 요구 사항을 크게 줄이는 등 여러 가지 최적화를 수행했으며 성능이 다른 장치에 맞는 여러 구성을 지원합니다. 사용자는 단순화 된 설치 프로세스를 통해이 도구를 신속하게 시작할 수 있습니다. 연속 버전 업데이트를 통해 WAN2.1GP는 차 캐시 지원, Gradio 인터페이스 개선 등과 같은보다 실용적인 기능을 점차적으로 추가하여 생성 속도와 사용 편의성을 더욱 향상 시켰습니다.
프로젝트 입구 : https://github.com/deepbeepmeep/wan2gp
핵심 사항 :
SOTA 성능 : WAN2.1GP는 기존 오픈 소스 및 상업용 솔루션을 능가하는 여러 벤치 마크에서 잘 작동합니다.
강력한 호환성 : 8.19GB의 비디오 메모리 만 필요하며, 거의 모든 소비자 등급 GPU를 지원하며 저가 사용자에게 적합합니다.
멀티 태스킹 지원 : 텍스트에서 비디오, 이미지에서 비디오에서 비디오 대 이미지와 같은 다중 세대 작업을 지원하며 중국어 및 영어 텍스트를 생성 할 수 있습니다.