9 de março de 2025, Califórnia, EUA - O modelo de código aberto está tornando a tecnologia de vídeo Wensheng cada vez mais interessante. O desenvolvedor de IA Ostris (@OStrisai) compartilhou recentemente os resultados de seu modelo WAN2.1lora treinado na plataforma X. Com apenas cerca de 20 fotos e uma placa gráfica RTX4090 em casa, ele alcançou incríveis efeitos de geração de vídeo. Esse resultado não apenas demonstra o potencial da tecnologia de código aberto, mas também desencadeia uma discussão acalorada na comunidade X nas ferramentas de treinamento de vídeo Lora.

Experiência incrível de Ostris
Ostris mostrou os resultados do treinamento pela primeira vez no WAN2.114b Lora em um post de 7 de março. Ele escreveu: "O treinamento Wan2.114b Lora é executado com sucesso em 24 GB! Média 1,7 segundos por etapa na resolução de 480p em 4090". Ele também compartilhou um vídeo preliminar que demonstrou a viabilidade desse modelo no hardware doméstico. Então, em 9 de março, ele lançou ainda um "videoclipe de curta-metragem de prova de conceito de baixo custo", que foi combinado com letras que ele criou e música gerada por @sunomusic. A imagem digital no vídeo foi treinada em suas próprias fotos.
Ostris disse que usou apenas cerca de 20 fotos pessoais, concluindo o processo com a ferramenta de treinamento de vídeo Lora que ele desenvolveu. Ele suspirou no post: "Eu não esperava que o efeito fosse tão bom! Eu me diverti muito". Esse experimento não apenas verificou o desempenho poderoso do WAN2.1lora, mas também mostrou a possibilidade de usuários comuns usando ferramentas de código aberto para obter vídeos literários de alta qualidade.
Ferramenta de treinamento Compartilhamento de código aberto A ferramenta de treinamento de vídeo LORA, desenvolvida pela Ostris, tornou -se um destaque deste lançamento. Usuário @sundyme postado em 9 de março: "O Treinamento do Video Lora está aqui, deixe você se tornar o protagonista do vídeo da IA!" e link de ferramenta compartilhado de ostris. Essa ferramenta suporta o modelo WAN2.1, permitindo que os usuários treinem modelos de vídeo personalizados com um pequeno número de fotos, diminuindo significativamente o limite técnico.
X Usuários mostram um forte interesse nessa ferramenta. @Sundyme disse: "A ferramenta de treinamento da LORA, desenvolvida por @OStrisai, suporta WAN2.1 e tem resultados surpreendentes". O feedback da comunidade mostra que a operação eficiente da ferramenta em placas de gráficos de consumo, como o RTX4090, permite que mais criadores experimentem a geração de vídeo da IA em casa.
Resposta da comunidade e significado técnico
A resposta em X mostra que os resultados da Ostris despertaram entusiasmo generalizado. Um usuário comentou: "É incrível treinar uma pessoa digital tão realista com 20 fotos!" Outro usuário elogiou o potencial do modelo de código aberto: "Os vídeos de Wensheng estão se tornando cada vez mais interessantes, e o código aberto permite que as pessoas comuns brincem com a IA".
Os especialistas do setor acreditam que o experimento da Ostris destaca o avanço dos modelos de código aberto no campo da geração de vídeo. O WAN2.1lora combina a tecnologia de treinamento com poucas amostras, não apenas reduz os requisitos de hardware, mas também melhora a acessibilidade da criação personalizada. Essa abordagem abre novos caminhos para desenvolvedores independentes e pequenas equipes em comparação com modelos tradicionais que exigem grandes conjuntos de dados e servidores de alto desempenho.
Endereço do projeto: https://github.com/ostris/ai-toolkit