OpenAI 推出了最新的AI代理“Operator”,這是一個旨在幫助用戶在線執行各種任務的強大工具。它結合了GPT-4o的視覺能力和強化學習的高級推理,能夠與圖形用戶界面(GUI)進行交互,無需定制API集成即可在網絡上自主行動。目前Operator處於研究預覽階段,僅面向美國ChatGPT Pro訂閱用戶開放,月費200美元。本文將詳細介紹Operator的功能、安全性和未來發展計劃。
OpenAI 宣布推出其最新AI 代理“Operator”,這一工具旨在幫助用戶在網絡上執行各種任務。 OpenAI 在其博客中表示,Operator 正在進行“研究預覽”,初步面向美國的ChatGPT Pro 訂閱用戶,月費為200美元。

Operator 的設計理念是通過一種稱為“計算機使用代理” 的模型,結合了GPT-4o 的視覺能力和強化學習的高級推理,能夠與圖形用戶界面(GUI)進行交互。 OpenAI 解釋道,Operator 可以通過其內置的瀏覽器查看網頁,並通過鍵入、單擊和滾動等方式與頁面進行交互。這一技術的優勢在於,Operator 能夠在不需要定制API 集成的情況下,在網絡上自主行動。

在使用過程中,Operator 不僅能夠利用推理能力進行“自我糾正”,還會在遇到困難時將控制權交還給用戶。當網站請求敏感信息,例如登錄憑據時,Operator 會詢問用戶是否接管該操作。此外,Operator 在處理諸如發送電子郵件等事務時,也會要求用戶進行確認。 OpenAI 強調,Operator 在設計上特別注重安全性,旨在拒絕有害請求並屏蔽不允許的內容。
OpenAI 還透露,Operator 正在與多個知名公司合作,如DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 和Uber 等,以確保其滿足現實世界的需求,並遵循已建立的行業規範。不過,OpenAI 也提醒用戶,目前該工具在處理複雜界面時可能會遇到困難,例如創建幻燈片或管理日曆。
OpenAI 計劃將Operator 擴展至Plus、Team 和Enterprise 用戶,並將這些功能整合進ChatGPT 中。這意味著更多用戶將有機會體驗到這一前沿技術所帶來的便利。
官方播客:https://openai.com/index/introducing-operator/
劃重點:
OpenAI 推出“Operator” AI 智能體,幫助用戶在線執行任務,首批面向ChatGPT Pro 用戶。
Operator 可以通過瀏覽器與網頁交互,具備自我糾正和用戶控制的功能,確保安全性。
OpenAI 與多個知名公司合作,致力於滿足現實需求,同時計劃未來擴展至更多用戶。
總而言之,Operator 是OpenAI在AI代理領域的一次大膽嘗試,它展現了AI在自動化網絡任務方面的巨大潛力。雖然目前仍處於早期階段,但其未來的發展值得期待,也預示著未來AI與人類互動的更多可能性。