OpenAI 推出了最新的AI代理“Operator”,这是一个旨在帮助用户在线执行各种任务的强大工具。它结合了GPT-4o的视觉能力和强化学习的高级推理,能够与图形用户界面(GUI)进行交互,无需定制API集成即可在网络上自主行动。目前Operator处于研究预览阶段,仅面向美国ChatGPT Pro订阅用户开放,月费200美元。本文将详细介绍Operator的功能、安全性和未来发展计划。
OpenAI 宣布推出其最新 AI 代理 “Operator”,这一工具旨在帮助用户在网络上执行各种任务。OpenAI 在其博客中表示,Operator 正在进行 “研究预览”,初步面向美国的 ChatGPT Pro 订阅用户,月费为200美元。

Operator 的设计理念是通过一种称为 “计算机使用代理” 的模型,结合了 GPT-4o 的视觉能力和强化学习的高级推理,能够与图形用户界面(GUI)进行交互。OpenAI 解释道,Operator 可以通过其内置的浏览器查看网页,并通过键入、单击和滚动等方式与页面进行交互。这一技术的优势在于,Operator 能够在不需要定制 API 集成的情况下,在网络上自主行动。

在使用过程中,Operator 不仅能够利用推理能力进行 “自我纠正”,还会在遇到困难时将控制权交还给用户。当网站请求敏感信息,例如登录凭据时,Operator 会询问用户是否接管该操作。此外,Operator 在处理诸如发送电子邮件等事务时,也会要求用户进行确认。OpenAI 强调,Operator 在设计上特别注重安全性,旨在拒绝有害请求并屏蔽不允许的内容。
OpenAI 还透露,Operator 正在与多个知名公司合作,如 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 和 Uber 等,以确保其满足现实世界的需求,并遵循已建立的行业规范。不过,OpenAI 也提醒用户,目前该工具在处理复杂界面时可能会遇到困难,例如创建幻灯片或管理日历。
OpenAI 计划将 Operator 扩展至 Plus、Team 和 Enterprise 用户,并将这些功能整合进 ChatGPT 中。这意味着更多用户将有机会体验到这一前沿技术所带来的便利。
官方播客:https://openai.com/index/introducing-operator/
划重点:
OpenAI 推出 “Operator” AI 智能体,帮助用户在线执行任务,首批面向 ChatGPT Pro 用户。
Operator 可以通过浏览器与网页交互,具备自我纠正和用户控制的功能,确保安全性。
OpenAI 与多个知名公司合作,致力于满足现实需求,同时计划未来扩展至更多用户。
总而言之,Operator 是OpenAI在AI代理领域的一次大胆尝试,它展现了AI在自动化网络任务方面的巨大潜力。虽然目前仍处于早期阶段,但其未来的发展值得期待,也预示着未来AI与人类互动的更多可能性。