今年年底,国内各大视频平台的技术竞争异常激烈。通义万相首次推出的生成汉字视频技术,引发了AI创作领域的热烈反响。紧接着,海螺AI又推出了全新的主体参考功能,这一创新使得AI视频创作达到了新的高度。用户只需上传一张图片,便能让任何角色在各种场景中自如活动,既保持了角色的高度还原,又赋予了创作者极大的自由度。

社交媒体上,创作者们纷纷展示他们的作品,从蜘蛛侠骑着机车的场景到《权力的游戏》中龙母与森林小狼的互动,这些角色形象不仅保持了高度的还原,还展现了出色的稳定性。
与传统的图生视频技术相比,海螺AI的"主体参考"功能采用了全新的技术路径。这项技术不仅仅是让静态图片产生局部动作,而是能够基于文字提示词(prompt)生成完整的视频片段,极大地丰富了视频内容的表现力。
从官方提供的演示视频中可以看到,用户上传一张人物照片后,系统不仅能准确保持人物的面部特征,还能让其在场景中执行各种自然连贯的动作,如滑滑板、骑车、挑眉或皱眉等,面部表情的细节处理也非常到位。
在技术实现方面,海螺AI选择了基于图片参考的路线,而非传统的LoRA技术。这一策略使得用户无需准备大量素材,仅凭一张图片即可准确识别并还原人物特征。此外,生成速度也得到了显著提升,从之前的长时间等待缩短至秒级响应。
这项技术的商业潜力同样巨大。根据Statista的数据,预计到2028年,广告营销领域的生成式AI产品市场规模将达到1075亿美元。"主体参考"功能正好满足了这一市场需求,特别是在产品广告制作方面,仅需一张模特图片即可针对不同产品场景生成多个版本的视频内容。
作为一家仅成立3年的初创企业,MiniMax通过海螺AI在全球AI视频生成领域确立了领先地位。目前,全球范围内展现出真正技术实力和发展潜力的仅有海螺AI、可灵AI和即梦AI三家,这标志着中国企业在全球AI视频生成领域的崛起。
展望未来,海螺AI计划将"主体参考"功能扩展到多人、物体和场景等更多领域,进一步释放创作潜能。在AI视频生成即将进入下半场之际,这项技术的出现无疑为创作者们带来了更多可能性,让"每个想法都是一部大片"的愿景逐渐成为现实。
体验地址:https://hailuoai.com/video/create