Recientemente, el equipo de DeepBeepMeep lanzó WAN2.1GP en GitHub, un modelo de generación de videos optimizado para usuarios de GPU de gama baja. Basado en WAN2.1 de Alibaba, el modelo está diseñado para proporcionar fuertes capacidades de generación de videos para los usuarios que carecen de recursos de GPU de alto rendimiento. El lanzamiento de WAN2.1GP marca un avance importante en la tecnología de generación de videos, especialmente en el campo de código abierto.
Las características principales de WAN2.1GP incluyen su excelente rendimiento y amplia aplicabilidad. El modelo continúa superando los modelos de código abierto existentes y algunas soluciones comerciales en múltiples puntos de referencia, mostrando una fuerte competitividad. Además, el modelo T2V-1.3B requiere solo 8.19 GB de memoria de video, lo que hace que casi todas las GPU de grado de consumo se ejecuten. Con una tarjeta gráfica RTX4090, los usuarios pueden generar un video de 480p de 5 segundos en aproximadamente 4 minutos, y su rendimiento es incluso comparable a algunos modelos de código cerrado.
WAN2.1GP no solo admite texto a video, imagen a video, edición de video y otras tareas, sino que también es el primer modelo de video que puede generar texto chino e inglés al mismo tiempo. Esta característica aporta más posibilidades a las aplicaciones prácticas de los usuarios. Además, el modelo está equipado con un potente Autoencoder de Video Variacional (VAE), que puede codificar de manera eficiente y decodificar videos de 1080p de cualquier longitud, reteniendo la información de tiempo intacta, estableciendo una base sólida para la generación de videos e imágenes.
Para mejorar la experiencia del usuario, WAN2.1GP ha realizado varias optimizaciones, incluida la reducción significativa de los requisitos de memoria de memoria y video, y admite múltiples configuraciones para adaptarse a los dispositivos con diferentes rendimientos. Los usuarios pueden comenzar rápidamente con esta herramienta a través de un proceso de instalación simplificado. Con las actualizaciones de la versión continua, WAN2.1GP ha agregado gradualmente funciones más prácticas, como soporte de caché de té, mejora de la interfaz de Gradio, etc., mejorando aún más la velocidad de generación y la conveniencia de uso.
Entrada del proyecto: https://github.com/deepbeepmeep/wan2gp
Puntos clave:
Rendimiento de SOTA: WAN2.1GP funciona bien en múltiples puntos de referencia, superando las soluciones comerciales y de código abierto existentes.
Fuerte compatibilidad: solo se requieren 8.19 GB de memoria de video, admite casi todas las GPU de grado de consumo, adecuado para usuarios de baja gama.
Soporte de múltiples tareas: admite tareas de generación múltiple como texto a video, imagen a video y tiene la capacidad de generar textos chinos e ingleses.