9 de marzo de 2025, California, EE. UU. - El modelo de código abierto está haciendo que la tecnología de video de Wensheng sea cada vez más interesante. El desarrollador de IA Ostris (@ostrisai) recientemente compartió los resultados de su modelo wan2.1lora entrenado en la plataforma X. Con solo unas 20 fotos y una tarjeta gráfica RTX4090 casera, logró increíbles efectos de generación de videos. Este resultado no solo demuestra el potencial de la tecnología de código abierto, sino que también desencadena una acalorada discusión en la comunidad X en las herramientas de capacitación de video Lora.

El increíble experimento de Ostris
Ostris mostró por primera vez los resultados de entrenamiento de WAN2.114b Lora en un puesto de 7 x de marzo. Él escribió: "Wan2.114b Lora Training se ejecuta con éxito en 24 GB! Promedio de 1.7 segundos por paso a 480p resolución en 4090". También compartió un video preliminar que demostró la viabilidad de este modelo en el hardware doméstico. Luego, el 9 de marzo, lanzó un "video musical corto de prueba de bajo costo de concepto", que se combinó con las letras que creó y la música generada por @sunomusic. La imagen digital en el video fue entrenada en sus propias fotos.
Ostris dijo que usó solo unas 20 fotos personales, completando el proceso con la herramienta de entrenamiento de video Lora que desarrolló. Suspiró en la publicación: "¡No esperaba que el efecto fuera tan bueno! Me divertí mucho". Este experimento no solo verificó el poderoso rendimiento de Wan2.1lora, sino que también mostró la posibilidad de que los usuarios comunes usen herramientas de código abierto para lograr videos literarios de alta calidad.
Herramienta de capacitación Open Source Compartir la herramienta de entrenamiento de video Lora desarrollada por Ostris se ha convertido en lo más destacado de este lanzamiento. Usuario @Sundyme Publicado el 9 de marzo: "Video Lora Training está aquí, ¡te convierte en la protagonista del video de IA!" y el enlace de herramienta de Ostris compartido. Esta herramienta admite el modelo WAN2.1, lo que permite a los usuarios capacitar a modelos de video personalizados con una pequeña cantidad de fotos, reduciendo significativamente el umbral técnico.
X Los usuarios muestran un gran interés en esta herramienta. @Sundyme dijo: "La herramienta de entrenamiento Lora desarrollada por @ostrisai admite WAN2.1 y tiene resultados sorprendentes". Los comentarios de la comunidad muestran que el funcionamiento eficiente de la herramienta en las tarjetas de gráficos de consumo, como RTX4090, permite que más creadores prueben la generación de videos AI en el hogar.
Respuesta de la comunidad e importancia técnica
La respuesta en X muestra que los resultados de Ostris han provocado un entusiasmo generalizado. Un usuario comentó: "¡Es increíble entrenar a una persona digital tan realista con 20 fotos!" Otro usuario elogió el potencial del modelo de código abierto: "Los videos de Wensheng se están volviendo cada vez más interesantes, y el código abierto permite a las personas comunes jugar con IA".
Los expertos de la industria creen que el experimento de Ostris destaca el avance de los modelos de código abierto en el campo de la generación de videos. Wan2.1lora combina la tecnología de entrenamiento con pocas muestras, no solo reduce los requisitos de hardware, sino que también mejora la accesibilidad de la creación personalizada. Este enfoque abre nuevas rutas para desarrolladores independientes y equipos pequeños en comparación con los modelos tradicionales que requieren grandes conjuntos de datos y servidores de alto rendimiento.
Dirección del proyecto: https://github.com/ostris/ai-toolkit