Até o final deste ano, a competição tecnológica entre as principais plataformas de vídeo domésticas é extremamente feroz. O primeiro lançamento de Tongyi Wanxiang da tecnologia de vídeo em chinês desencadeou uma resposta calorosa no campo da criação de IA. Imediatamente depois, a Conch AI lançou uma nova função de referência de sujeitos, e essa inovação trouxe a criação de vídeo da IA a um novo nível. Os usuários precisam apenas fazer upload de uma imagem para permitir que qualquer personagem se mova livremente em várias cenas, o que não apenas mantém a alta restauração do personagem, mas também oferece aos criadores grande liberdade.

Nas mídias sociais, os criadores mostram seus trabalhos, desde a cena do Homem-Aranha montando uma motocicleta até a interação entre a mãe dragão e o lobo da floresta em Game of Thrones, esses personagens não apenas mantêm um alto grau de restauração, mas também mostram o Excelente estabilidade.
Comparado com a tradicional tecnologia de vídeo Tusheng, a função "Referência de Assuntos" da Conch AI adota um caminho técnico completamente novo. Essa tecnologia não apenas permite que imagens estáticas produza ações locais, mas pode gerar videoclipes completos com base em palavras solicitadas por texto (prompt), enriquecendo bastante a expressividade do conteúdo de vídeo.
No vídeo oficial de demonstração, podemos ver que, depois que o usuário carrega uma foto de personagem, o sistema pode não apenas garantir com precisão as características faciais da pessoa que segura o personagem, mas também permitir que ele execute várias ações naturais e coerentes na cena,, como andar de skate e andar de bicicleta.
Em termos de implementação técnica, a Conch AI escolheu uma rota baseada na referência da imagem, e não na tecnologia LORA tradicional. Essa estratégia permite que os usuários identifiquem e restaurem com precisão os recursos de caracteres com base em apenas uma imagem sem preparar uma grande quantidade de material. Além disso, a velocidade de geração também foi significativamente melhorada, redução da longa espera anterior para a resposta de segundo nível.
O potencial comercial dessa tecnologia é igualmente enorme. De acordo com a Statista, espera -se que o tamanho do mercado de produtos generativos de IA no campo de marketing de publicidade atinja US $ 107,5 bilhões até 2028. A função "Referência psicológica" atende a essa demanda de mercado, especialmente na produção de publicidade de produtos, onde você precisa apenas de uma imagem de modelo para gerar várias versões de conteúdo de vídeo para diferentes cenários de produtos.
Como uma startup que foi estabelecida há apenas 3 anos, o MinMAX estabeleceu uma posição de liderança na geração global de vídeos da IA através da Conch AI. Atualmente, apenas Conch AI, Keling AI e Jimeng AI mostraram um potencial real de força e desenvolvimento técnico em todo o mundo, o que marca a ascensão das empresas chinesas no campo de geração de vídeo global da IA.
Olhando para o futuro, a Conch IA planeja expandir a função de "referência do sujeito" a mais áreas como várias pessoas, objetos e cenas, liberam ainda mais o potencial criativo. Como a geração de vídeo da IA está prestes a entrar no segundo tempo, o surgimento dessa tecnologia, sem dúvida, traz mais possibilidades aos criadores, tornando a visão de "toda idéia ser um sucesso de bilheteria" gradualmente se tornar realidade.
Endereço de experiência: https://hailuoai.com/video/create