La IA de vídeo Sora de OpenAI vuelve a estar en el centro de atención, y su próxima importante actualización atrae mucha atención. El editor de Downcodes le explicará los desafíos técnicos y la competencia del mercado detrás de la actualización de Sora, así como su impacto en la creación de videos futuros.
OpenAI ha causado recientemente un gran revuelo en el campo de la IA de vídeo. Están realizando una importante actualización de Sora, que se lanzó en febrero de este año. Según Information Daily, el objetivo principal de esta actualización es mejorar significativamente el rendimiento de Sora, permitiéndole generar contenido de vídeo más largo y de mayor calidad más rápidamente.
Si analizamos el rendimiento de la primera versión de Sora, de hecho hay muchos problemas que deben resolverse. La versión inicial tardó más de 10 minutos en generar un vídeo y esta eficiencia obviamente no podía satisfacer las necesidades de las aplicaciones prácticas. Es más, muchos cineastas se han quejado de la calidad de producción de Sora.
La experiencia del productor Patrick Cederberg es un ejemplo clásico: tuvo que generar cientos de clips para conseguir un vídeo utilizable. El desempeño de Sora a la hora de mantener la coherencia del estilo, los objetos y los personajes es deficiente, y los errores físicos son frecuentes. Estos problemas afectan seriamente su practicidad.

Nota sobre la fuente de la imagen: la imagen es generada por IA y la imagen está autorizada por el proveedor de servicios Midjourney
Sin embargo, estos desafíos no son infrecuentes en el campo de la IA de vídeo. El desarrollo de la nueva versión de Sora va dirigido a estos problemas. Para mejorar integralmente el rendimiento del sistema, OpenAI está recopilando millones de horas de videos de alta resolución como materiales de capacitación, que cubren una variedad de estilos y temas, con el objetivo de reducir el sesgo del modelo y mejorar la calidad de los resultados.
Vale la pena señalar que desde el lanzamiento de Sora, la competencia en el mercado de la IA de vídeo se ha vuelto cada vez más feroz. Se han lanzado en el mercado chino cuatro nuevos sistemas: Keling, Vidu, Jimeng AI y MiniMax. Al mismo tiempo, Runway ML no se queda atrás, lanzó dos nuevos modelos de IA y acaba de anunciar una asociación con Lionsgate. Esta situación competitiva sin duda promoverá el rápido desarrollo de toda la industria.
Aunque OpenAI le dijo a CNBC a principios de septiembre de este año que Sora todavía estaba en la etapa de investigación y requería discusiones en profundidad con los responsables políticos, la CTO de la compañía, Mira Murati, mostró plena confianza a mediados de marzo. Dejó en claro que Sora será lanzado oficialmente este año. Sin embargo, Murati también admitió que los costos operativos actuales del sistema son demasiado altos y se describen como artículos de lujo entre los lujos. Por lo tanto, reducir los costos de generación también es una tarea importante para OpenAI.
Esta actualización de Sora es sin duda un viaje lleno de desafíos y oportunidades. No sólo necesita resolver problemas técnicos, sino también encontrar un equilibrio entre eficiencia, costo y calidad. Si OpenAI puede superar con éxito estos obstáculos, es probable que Sora se convierta en un importante punto de inflexión en la industria de la producción de vídeo.
A medida que la tecnología de inteligencia artificial continúa profundizándose en el campo del video, podemos prever que la creación de videos en el futuro será más eficiente y diversa. Esto no sólo proporcionará nuevas herramientas para los productores profesionales, sino que también puede abrir un nuevo mundo de creación de vídeos para los usuarios comunes. Aunque Sora todavía enfrenta muchos desafíos, su dirección de desarrollo sin duda representa la tendencia futura de la IA de video.
El camino de actualización de Sora está lleno de desafíos, pero su potencial de desarrollo futuro es enorme. Esperemos y veamos si OpenAI puede superar con éxito las dificultades técnicas y revolucionar la creación de videos. El editor de Downcodes seguirá prestando atención a los últimos avances de Sora y brindándole información de primera mano.