Recentemente, a equipe DeepBeepmeep lançou o WAN2.1GP no GitHub, um modelo de geração de vídeo otimizado para usuários de GPU de baixa forma. Com base no WAN2.1 do Alibaba, o modelo foi projetado para fornecer fortes recursos de geração de vídeo para usuários que não possuem recursos de GPU de alto desempenho. O lançamento do WAN2.1GP marca um importante avanço na tecnologia de geração de vídeo, especialmente no campo de código aberto.
Os principais recursos do WAN2.1GP incluem seu excelente desempenho e ampla aplicabilidade. O modelo continua a superar os modelos de código aberto existentes e algumas soluções comerciais em vários benchmarks, mostrando forte competitividade. Além disso, o modelo T2V-1.3B requer apenas 8,19 GB de memória de vídeo, o que faz com que quase todas as GPUs de nível de consumo sejam executadas. Com uma placa gráfica RTX4090, os usuários podem gerar um vídeo de 5 segundos de 480p em cerca de 4 minutos, e seu desempenho é comparável a alguns modelos de código fechado.
O WAN2.1GP não suporta apenas texto para vídeo, imagem para vídeo, edição de vídeo e outras tarefas, mas também é o primeiro modelo de vídeo que pode gerar texto em chinês e inglês ao mesmo tempo. Esse recurso traz mais possibilidades aos aplicativos práticos dos usuários. Além disso, o modelo está equipado com um poderoso AutoEncoder de vídeo em vídeo (VAE), que pode codificar e decodificar com eficiência os vídeos 1080p de qualquer comprimento, mantendo intactas informações sobre o tempo, estabelecendo uma base sólida para geração de vídeo e imagem.
Para melhorar a experiência do usuário, o WAN2.1GP fez várias otimizações, incluindo reduzir significativamente os requisitos de memória e memória de vídeo e suporta várias configurações para atender a dispositivos com desempenho diferente. Os usuários podem começar rapidamente com essa ferramenta através de um processo de instalação simplificado. Com as atualizações contínuas da versão, o WAN2.1GP adicionou gradualmente mais funções práticas, como suporte de cache de chá, melhoria da interface gradio etc., melhorando ainda mais a velocidade de geração e a conveniência do uso.
Entrada do projeto: https://github.com/deepbeepmeep/wan2gp
Pontos -chave:
Desempenho do SOTA: o WAN2.1GP tem um bom desempenho em vários benchmarks, superando soluções de código aberto e comerciais existentes.
Forte compatibilidade: apenas 8,19 GB de memória de vídeo é necessária, ele suporta quase todas as GPUs de nível de consumo, adequadas para usuários de baixo custo.
Suporte de várias tarefas: suporta várias tarefas de geração, como texto para vídeo, imagem para vídeo e tem a capacidade de gerar textos chineses e ingleses.