在今年的世界移动通信大会(MWC)上,谷歌宣布为其 Gemini 助手新增实时视频分析和屏幕共享功能。这一重大更新标志着人工智能助手在现实世界交互能力上的又一次突破。Gemini Advanced 的 Google One AI Premium 订阅用户将成为首批体验者,他们将在本月晚些时候率先使用这些创新功能。
此次更新为 Gemini Live 带来了两大核心能力:首先,它可以通过外部摄像头实时分析视频内容,使 AI 能够"看到"并理解用户所处的环境;其次,新增的屏幕共享功能让 AI 助手能够直接解读用户手机上的信息,并提供即时反馈。这些功能的加入,使得用户与 AI 的互动方式更加丰富和直观。例如,用户可以让 AI 识别周围物体、解析屏幕内容,或者根据实时场景提供建议,大大提升了 AI 助手的实用性和交互性。

新功能将首先在 Android 设备上推出,并支持多种语言,体现了谷歌对全球用户的重视。在 MWC 现场,谷歌展示了这些功能在各大 Android 设备中的无缝集成,进一步巩固了其在 AI 助手领域的领先地位。这一战略部署不仅展示了谷歌的技术实力,也彰显了其致力于为用户提供更智能、更便捷的移动体验的决心。
此次更新是谷歌在 AI 助手领域迈出的重要一步,也是其实现 Project Astra 愿景的关键进展。Project Astra 是谷歌正在开发的通用多模态 AI 助手,旨在实时处理文本、视频、音频等多种信息,并具备短期记忆能力。未来,Astra 将与谷歌搜索、Lens 和地图等工具深度结合,为用户提供更加智能和个性化的服务。这一长期规划显示了谷歌在人工智能领域的宏大愿景和战略布局。
随着 Gemini Live 的推出,谷歌与 OpenAI 之间的竞争进入白热化阶段。自去年12月起,ChatGPT 已支持高级语音模式的实时视频和屏幕共享功能,而谷歌此次更新无疑是对其正面迎战的一步。这场 AI 领域的竞争不仅推动了技术的快速进步,也为用户带来了更多创新功能。Gemini 能否借助这项新功能进一步巩固 AI 领先地位,值得持续关注。这场科技巨头的竞争,最终将推动整个人工智能行业的发展,为用户带来更智能、更便捷的数字生活体验。