Récemment, l'équipe DeepbeepMep a publié WAN2.1GP sur GitHub, un modèle de génération de vidéos optimisé pour les utilisateurs de GPU bas de gamme. Basé sur WAN2.1 d'Alibaba, le modèle est conçu pour fournir de solides capacités de génération de vidéos aux utilisateurs qui manquent de ressources GPU hautes performances. Le lancement de WAN2.1GP marque un progrès important dans la technologie de génération de vidéos, en particulier dans le domaine open source.
Les principales caractéristiques de WAN2.1GP incluent ses excellentes performances et son large applicabilité. Le modèle continue de dépasser les modèles open source existants et certaines solutions commerciales dans plusieurs repères, montrant une forte compétitivité. De plus, le modèle T2V-1.3b ne nécessite que 8,19 Go de mémoire vidéo, ce qui fait presque tous les GPU de qualité grand public. Avec une carte graphique RTX4090, les utilisateurs peuvent générer une vidéo 480p de 5 secondes en environ 4 minutes, et leurs performances sont même comparables à certains modèles de source fermée.
WAN2.1GP prend non seulement du texte en vidéo, en image à vidéo, en montage vidéo et en autres tâches, mais est également le premier modèle vidéo qui peut générer du texte chinois et anglais en même temps. Cette fonctionnalité apporte plus de possibilités aux applications pratiques des utilisateurs. De plus, le modèle est équipé d'un puissant autoencoder Video Variational (VAE), qui peut coder et décoder efficacement les vidéos 1080p de n'importe quelle longueur, conservant les informations de temps intactes, jetant une base solide pour la génération vidéo et d'image.
Pour améliorer l'expérience utilisateur, WAN2.1GP a fait plusieurs optimisations, notamment en réduisant considérablement les exigences de mémoire et de mémoire vidéo, et prend en charge plusieurs configurations pour s'adapter aux appareils avec différentes performances. Les utilisateurs peuvent rapidement démarrer avec cet outil via un processus d'installation simplifié. Avec les mises à jour de la version continue, WAN2.1GP a progressivement ajouté des fonctions plus pratiques, telles que le support du cache de thé, l'amélioration de l'interface Gradio, etc., améliorant davantage la vitesse de génération et la commodité d'utilisation.
Entrée du projet: https://github.com/deepbeepmeep/wan2gp
Points clés:
Performance SOTA: WAN2.1GP fonctionne bien dans plusieurs repères, dépassant les solutions open source et commerciales existantes.
Compatibilité forte: seulement 8,19 Go de mémoire vidéo sont nécessaires, il prend en charge presque tous les GPU de qualité grand public, adaptés aux utilisateurs bas de gamme.
Prise en charge multi-tâches: prend en charge plusieurs tâches de génération telles que le texte en vidéo, l'image à la vidéo et a la capacité de générer des textes chinois et anglais.