Tras la actualización de la versión de septiembre, Guangcone Intelligence se enteró por el círculo de amigos de Tang Jiayu, cofundador y director ejecutivo de Shengshu Technology, que el modelo grande de Vidu se actualizará nuevamente esta semana y que pronto se lanzará la versión Vidu-1.5.
La dirección de actualización de esta versión todavía se centra en ampliar la capacidad de generalización y la coherencia temática de modelos grandes. La versión anterior se centraba en la coherencia de un solo tema, mientras que la última versión puede comprender e integrar múltiples conceptos como personajes, objetos y entornos, y seguir las instrucciones del usuario para generar resultados de video relevantes de la fusión de múltiples temas en 30 segundos, tomando el Liderar la creación de videos.
Además de Vidu, desde septiembre de este año, según estadísticas incompletas, las principales plataformas de generación de videos de IA, incluidas Jimeng AI de Bytedance, Kuaishou Keling AI, Runway, Zhipu Qingying, Aishi Technology PixVerse y pika, han actualizado todas las versiones.

Actualmente, en la candente pista de generación de videos de IA, grandes empresas emergentes de modelos y las principales empresas de Internet han ingresado al juego. Después de lanzamientos intensivos de productos en la etapa inicial, ahora ha entrado en la etapa de competencia de iteración y actualización de productos.
A través del contenido actualizado de cada versión, no es difícil encontrar que la dirección general de iteración de las capacidades del modelo grande de generación de video AI sigue siendo la duración del video generado, la estabilidad y continuidad de la imagen y la consistencia del tema. antes y después.
Pero al mismo tiempo, varios actores comenzaron a "dividirse" en aplicaciones funcionales reales, cada uno con su propio énfasis. Algunos actores pequeños y medianos también comenzaron a encontrar sus propios segmentos de mercado.
Por ejemplo, la última versión de Runway ha actualizado Act-One, que puede reproducir con precisión las expresiones faciales de personas reales en personajes de IA, para permitir el control de la cámara con IA 3D. PixVerse ha lanzado varios efectos especiales de Halloween, efectos especiales de veneno, etc.
Con respecto a esta ronda de actualizaciones de varias plataformas de generación de videos de IA, Chen Kun, fundador de Xingxian Culture y productor de la IP de fantasía original de IA "Mountains and Seas Mirror", cree: "La mayor actualización debería ser la expresión migración de Act- Uno, que proporciona una mejor manera para las actuaciones de los personajes. Posibilidades básicas". En cuanto a la consistencia y estabilidad de los personajes, "hay progreso, pero no hay progreso intergeneracional".
Según Vicky, la creadora de videos de IA, en comparación con el producto original en la primera mitad del año, la última plataforma de video de IA actualizada no solo ha iterado sobre las capacidades subyacentes del modelo, sino que también ha actualizado sus funciones, como cabeza y cola. unión, calidad de imagen y suplementación de velocidad de fotogramas, doblaje y otras funciones, "la mejora de estas funciones es en realidad más completa que en la primera mitad del año".
Si la primera mitad de 2024 es una carrera armamentista en la pista de generación de videos de IA, entonces la segunda mitad del año será un ciclo de actualización de versiones de pequeños pasos.
En esta etapa, la competencia entre Byte y Kuaishou sigue siendo feroz. Los pequeños y medianos fabricantes están comenzando a encontrar sus propios caminos únicos, y algunas empresas se están centrando en los mercados extranjeros y también han logrado el efecto de "florecer a nivel nacional y ser fragantes". fuera del muro".
Sin duda, la lucha en esta etapa puede parecer leve, pero tiene un impacto sustancial en el propio posicionamiento de la plataforma y la dirección de desarrollo futuro, así como en el posterior crecimiento sostenible de los grupos y la cantidad de usuarios.
"Jimeng está un poco atrasado", es una evaluación objetiva realizada por los usuarios de la plataforma de generación de videos con IA.
Como uno de los primeros lotes de plataformas de generación de video de IA del año pasado y producto de Byte, los efectos de generación de video de Dream AI han sido criticados por los usuarios y están siendo superados por jugadores como Runway y Pika.
En junio de este año, Kuaishou, el competidor directo de Byte en el campo de videos cortos, lanzó oficialmente el modelo de generación de videos grandes "Keling" en su sitio web oficial y rápidamente emergió de la industria. Al mismo tiempo, están surgiendo cada vez más plataformas de generación de videos con IA y la pista de generación de videos con IA está en pleno auge.
Bajo una fuerte presión competitiva, Bytedance, como el primer escalón de los productos nacionales de IA, ha compensado las deficiencias de la generación de video, que se ha convertido en una máxima prioridad, y su velocidad para ponerse al día está más allá de la imaginación.
El 24 de septiembre, se llevó a cabo la Gira de Innovación de AI de Volcano Engine 2024 en Shenzhen. Chen Xinran, ex director de Douyin Art, apareció como director de Jimeng AI y Cutting Market and Operations, y anunció que Jimeng AI se ha conectado a la última versión de Doubao. Modelo de generación de vídeo.
Al mismo tiempo, ByteDance lanzó dos modelos de generación de video, Seaweed y Pixeldance, de la familia de modelos Doubao, e invitó a creadores y clientes corporativos a realizar pruebas a pequeña escala a través de Jimeng AI y Huoshan Engine, respectivamente.
El 8 de noviembre, Dream AI, una plataforma de contenido de inteligencia artificial propiedad de ByteDance, anunció que Seaweed, un modelo de generación de video desarrollado por ByteDance, está oficialmente abierto a los usuarios de la plataforma.
Según ByteDance, el modelo de generación de video Beanbag Seaweed que está abierto para su uso esta vez es la versión estándar de este modelo. Solo toma 60 segundos generar un video AI de alta calidad de 5 segundos, que es de 3 a 5 minutos por delante. Todos los estándares de la industria nacional. Requiere tiempo de generación.
Jimeng AI también reveló que las versiones Pro de dos modelos de generación de video, Seaweed y Pixeldance, también estarán disponibles para su uso en un futuro próximo. El modelo de la versión Pro puede realizar acciones de múltiples disparos naturales y coherentes e interacciones complejas con múltiples sujetos, y supera el problema de consistencia del cambio de múltiples disparos. Puede mantener la consistencia del sujeto, el estilo y la atmósfera al cambiar de lente, y es. adecuado para películas, TV y computadoras, teléfonos móviles y otros dispositivos.
ByteDouyin y Kuaishou, como líderes de las plataformas nacionales de videos cortos, su competencia ha pasado del video corto y el comercio electrónico al campo de la inteligencia artificial. Objetivamente hablando, Douyin está por delante de Kuaishou en todos los aspectos. Pero sólo en el campo de la IA, Kuaishou ha dado un hermoso contraataque.
Desde su éxito instantáneo en junio, Kuaishou Keling ha tenido varias iteraciones de versiones más pequeñas.
Pero en términos de las capacidades subyacentes de los modelos grandes, el 20 de septiembre de este año, Kuaishou lanzó la versión 1.5 de Keling, que está conectada a una nueva generación de modelos y ha logrado mejoras significativas en la calidad de imagen y la calidad dinámica del modelo original. una nueva función: movimiento, el efecto de generación es más controlable.
"Keling 1.5 es muy fuerte. Se puede decir que es el más realista entre todos los modelos. En comparación con Runway, básicamente ha superado el problema anterior de la deformación del carácter", dijo el empresario AIGC AIgen (nombre artístico) a Lightcone Intelligence.
En los efectos de video generados reales, comparando Keling y Runway, podemos ver que con la misma palabra, ambos tienen un fuerte efecto en la estabilidad del personaje real, pero los efectos de video generados por Keling pueden desbloquear automáticamente la expresión de la cara. .
"Runway puede generar expresiones faciales por sí solo, pero el efecto es muy extraño", dijo Yamjiang AIgen. Sin embargo, las habilidades de Keling AI y Runway son aleatorias y no fijas.
De hecho, se puede ver que Keling AI y Runway son superiores en los efectos de generación real y, en términos de comprensión de las palabras clave, Keling AI está a la vanguardia, pero en el futuro aún será necesario actualizarlo continuamente de forma iterativa para que sea capaz de Esta habilidad se solidifica.
(Pasarela, palabra clave: una modelo femenina vistiendo ropa china nueva, mostrando su estilo, con humo colorido flotando en el fondo, proporcionado por AIgen)
(Keling AI, palabra clave: una modelo femenina vestida con ropa china nueva muestra su estilo, con humo colorido flotando en el fondo, proporcionado por Yamjiang AIgen)
Sin embargo, después de que Jimeng lanzó el último video para generar un modelo grande, Vicky cree que las capacidades del modelo y el diseño de la interfaz de usuario no son muy diferentes de Keling. Al mismo tiempo, durante las pruebas internas del modelo de la versión Jimeng Platform Pro, puede controlar fácilmente el rango de movimiento y las acciones de la pantalla.
Como plataformas de videos cortos líderes en China, Kuaishou y Bytedance han establecido sus vías de generación de videos con IA. El objetivo final es atraer y retener la atención de los usuarios, lo que requiere una producción continua de contenidos novedosos, creativos y de alta calidad.
En base a esto, los dramas cortos de IA también se han convertido en uno de los focos de competencia entre Bytedance y Kuaishou Keling.
En julio de este año, el drama corto de IA "Mountains and Seas and Strange Mirrors: Chopping Waves" creado por "Keling AI" atrajo una gran atención. El corto dramático se convirtió en el primer micro drama de fantasía original de AIGC en China.
En septiembre, Kuaishou Xingmang Short Drama y "Keling AI" lanzaron el "Concurso de creación de cortos Drama Xing You Lingxi-AI". Se informa que el concurso anima a más personas a unirse a la creación de dramas cortos de IA a través de diversas medidas, como recompensas de tráfico, premios honoríficos y firma de contenido.
Byte tampoco se queda atrás. Si bien Dream AI se ha asociado con Bona Pictures para lanzar el primer corto dramático de ciencia ficción generado por AIGC, "Sanxingdui: Future Apocalypse", también se está asociando con muchos "súper creadores" en la plataforma Douyin. Para lograr la cocreación, invitando a la plataforma hay fanáticos de alta calidad y expertos de gran influencia que se han unido al programa "Super Creator Alliance", con la esperanza de construir la comunidad de creación virtual más grande de China.
Pero en esta etapa, ya sea Douyin o Kuaishou, el contenido creado por los creadores de cine y televisión en sus plataformas de video es "difícil de salir del círculo", dijo Vicky, "porque aún no se ha formado todo el mercado y". Los usuarios finales de C no saben cómo usarlo. ¿Para qué está aquí? Habrá cierta demanda comercial para el cabezal, pero no hay mucha demanda y la situación general no es estable”.
Después de todo, todavía hay relativamente pocos creadores profesionales en el mundo en esta etapa, y la tecnología de modelos grandes de generación de videos con IA aún se encuentra en sus primeras etapas.
Por lo tanto, como plataforma de video líder, la competencia entre Byte y Kuaishou se está volviendo cada vez más feroz. Además de la batalla por la tecnología y los productos de inteligencia artificial subyacentes, lo más importante es quién puede tomar la iniciativa en explorar el camino del contenido basado en tecnología. . Después de todo, si la plataforma puede reunir a más creadores de contenido innovadores, puede crear un ecosistema comunitario más preocupado y amado por los usuarios.
Por supuesto, además de Byte y Kuaishou, otros jugadores en la ruta de generación de videos de IA también han comenzado a "dividirse". Algunos fabricantes pequeños y medianos también han comenzado a explorar y encontrar su propio camino hacia una competencia diferenciada.
En plataformas de videos cortos como Douyin y Kuaishou, puede ser difícil salir del círculo del contenido creado por algunos creadores, pero algunos videos que contienen efectos especiales de fantasmas y animales son extremadamente populares, como el video generado por IA de He Jiong y Huang Lei de repente pelea.

Para los jugadores en la pista de generación de video de IA, ByteDance y Kuaishou compiten en una gama completa de ecosistemas de tecnología y contenido, mientras que otros jugadores pequeños y medianos están más enfocados en segmentar la pista e identificar sus propias plataformas y posicionamiento de productos. convertirse en la base de la supervivencia y el desarrollo.
A finales de octubre, el director ejecutivo de Runway dejó claro en una carta abierta que Runway no es una empresa de inteligencia artificial, sino una empresa de medios y entretenimiento: "Creo que la era de las empresas de inteligencia artificial ha terminado".
En base a esto, mientras las principales empresas compiten para mejorar la duración, la fidelidad y la fluidez de la generación de videos con IA, Runway ha desarrollado claramente sus propias características en la pista de videos con IA: crear IA que sirva específicamente para el arte, los medios y el entretenimiento.
A juzgar por los efectos reales de generación de video de Runway, se puede decir que sus efectos sobre la estabilidad y consistencia de los personajes están a la vanguardia. Además de las capacidades técnicas básicas, en la última actualización de la versión, las dos nuevas funciones lanzadas por Runway, aunque pequeñas, brindarán una gran comodidad y enormes ahorros de costos a animadores, desarrolladores de juegos y cineastas.
Se puede decir que Runway es uno de los productos más populares entre los profesionales del cine y la televisión. Además de su solidez técnica, lo más importante es su rentabilidad.
"Runway es muy fragante. Usamos Keling con moderación, pero Runway es ilimitado. No importa si lo fumas cientos de veces al día". AIgen dijo: "La aleatoriedad de los videos de IA sigue siendo muy fuerte. Si cobras por "En mi opinión, puede resultar difícil para los creadores comunes afrontar este coste".
Por otro lado, si usas 1.000 yuanes para comprar puntos, puedes comprar 15.000 puntos keling. Cada vez que utilizas 35 puntos keling, solo se pueden generar 1.000 yuanes 428 veces. Para los verdaderos empresarios, básicamente no es suficiente: "A juzgar por la frecuencia de los más de 200 videos que genero todos los días en Runway, los puntos comprados por Keling por 1000 yuanes básicamente se agotan en 2 días".
En el artículo anterior de Guangcone Intelligence, "Los videos explosivos de IA, los grandes fabricantes van a la izquierda, las empresas emergentes van a la derecha", también se mencionó que el método de cobro de membresía adoptado por cada plataforma en esta etapa no se puede comercializar. Para los empresarios de circuito cerrado, la tasa de pago posterior y la disposición a pagar no serán muy altas. Hoy en día, parece que incluso para los empresarios que pueden lograr una comercialización de circuito cerrado, la rentabilidad también es un factor clave que afecta el uso de sus productos.
Además de Runway, Pika y Pixverse también han encontrado sus propios temas. Se puede ver en su última versión actualizada que el enfoque de estas dos compañías es entrenar algunos efectos especiales que los usuarios puedan usar directamente "Aunque la metáfora puede no ser apropiada, se acerca un poco a las pegatinas hechas por Douyin antes. ", dijo Patata Jiang AIgen.
Por ejemplo, durante el período de Halloween a finales de octubre, la versión Pixverse V3 agregó muchos efectos especiales nuevos con temas de Halloween, incluido el modo zombi, sombreros de mago, invasión de monstruos y otros efectos temáticos, así como efectos especiales de pellizco de IA similares a los de Pika. Funciones populares de extensión de video y pellizco de IA. Los usuarios pueden agregar entre 5 y 8 segundos adicionales de contenido a los videos existentes y pueden controlar con precisión la dirección del contenido de los clips recién agregados.
Con el reciente lanzamiento de la película "Venom: The Last Dance", PixVerse ha lanzado un nuevo efecto de video especial "We Are Venom" basado en el último modelo de video PixVerse V3, que puede generar geniales animaciones de Venom a partir de imágenes con un solo clic.
Actualmente, este tipo de efectos especiales fantasmales son muy populares entre los usuarios de las plataformas sociales. Anteriormente, Pika lanzó el efecto especial de pellizco de IA en la versión 1.5. Una vez lanzado, fue amado por los usuarios. También confió en este efecto de onda para lograr adelantamientos en las curvas. Conch AI, que comenzó a crecer casi al mismo tiempo que Pika, en realidad se basó en las actuaciones de los personajes y los paquetes de expresiones de memes para encender directamente la opinión pública extranjera y superar a otros en una esquina.

Efectos de pellizco de la IA de Pika
De hecho, aunque Conch AI se lanzó tarde, los profesionales de la industria tienen una buena opinión de Conch AI. "El desempeño de Conch AI en los movimientos de los personajes es muy bueno. El reciente video generado por AI de la pelea de He Jiong y Huang Lei fue generado por Conch AI", dijo Yangtaojiang AIgen.
Sin embargo, lo que es más importante, Conch AI ha logrado el efecto de "florecer en el país y fragante fuera de la pared". Como plataforma de generación de vídeos de IA lanzada en el extranjero por la empresa nacional de IA MiniMax, la popularidad de las búsquedas siguió aumentando una vez que se lanzó.
Según las estadísticas de la "Lista de productos de IA", el número de visitas a la versión web de Conch AI se disparó un 860% en septiembre, ocupando el primer lugar en crecimiento mundial y nacional en septiembre. Los usuarios extranjeros han compartido su experiencia en plataformas sociales y, en general, se cree que Conch AI es una de las mejores herramientas de generación de videos de IA actualmente en el mercado.
Con la popularidad de sus productos en los mercados extranjeros, MiniMax ha estado a la vanguardia del modelo grande Six Little Tigers en términos de capacidades de comercialización.
En comparación, plataformas como Vidu y Zhipu Qingying evolucionan constantemente en términos de coherencia de temas, estabilidad de personajes y duración de la generación de videos, pero aún no han formado su propio estilo y ventaja competitiva.
Aunque la tecnología de generación de vídeo con IA evoluciona constantemente y ha obtenido pistas segmentadas únicas. Sin embargo, el informe de investigación de Cinda Securities también muestra que la tecnología de generación de videos con IA aún necesita mejorarse aún más en términos de consistencia de caracteres, duración requerida y calidad de imagen para cumplir con los estándares de comercialización.
Al mismo tiempo, las principales herramientas de video de IA actuales todavía se encuentran en la etapa de competencia por la generación de video, y la mayoría de ellas son productos de función única. Todavía requiere el uso de una variedad de herramientas de creación de video diferentes en serie para lograrlo. efecto de producir directamente vídeos comercializables.
En el futuro, la plataforma de modelo grande de generación de video con IA aún necesitará continuar con una evolución iterativa.