Downcodes の編集者は、Zhipu 技術チームが最近、GLM テクノロジー - AutoGLM エージェントに基づいた研究結果を発表したことを知りました。このインテリジェントエージェントは、人間による携帯電話の操作をシミュレートし、WeChatのいいね、淘宝でのショッピング、シートリップでのホテルの予約など、さまざまな日常タスクを実行でき、AIアプリケーションを人々の日常生活に近づけます。その技術的な進歩は、大規模モデルのエージェントのタスク計画とアクション実行における多くの問題を解決し、複数の評価ベンチマークで他の競合製品を上回る大幅なパフォーマンス向上を達成したことにあります。 AutoGLM の出現は、人工知能の「電話の使用」分野における大きな進歩を示し、将来のインテリジェントなインタラクションに新たな可能性をもたらします。
Zhipu テクノロジー チームは最近、GLM テクノロジー チームの研究結果に基づいた新製品、AutoGLM を発売しました。AutoGLM は、人間による携帯電話の操作をシミュレートし、さまざまなタスクを実行できるエージェントです。 AutoGLM の開始は、「電話の使用」分野における人工知能の進歩を示し、AI の応用を人々の日常生活に近づけます。

AutoGLM は、WeChat のモーメントでの「いいね」やコメント、淘宝網での過去の注文商品の購入、シートリップでのホテルの予約、12306 での鉄道チケットの購入、美団でのテイクアウトの注文など、さまざまなタスクを実行できます。 AutoGLM のアプリケーション シナリオはこれに限定されません。理論上、AutoGLM は、複雑なワークフローを構築することなく、人間がビジュアル電子デバイス上で実行できる操作ロジックをすべて完了できます。
現在、ユーザーは「Zhipu Qingyan」プラグインをインストールすることで AutoGLM-Web を体験できます。これは、ユーザーが Web ページにアクセスしてクリックすることをシミュレートし、Web サイト上の高度な検索、要約、コンテンツ生成を自動的に完了できるブラウザ アシスタントです。さらに、AutoGLM は Android システム上で社内テスト アプリケーションも公開しており、Honor などの携帯電話メーカーとの緊密な協力を行っています。

AutoGLM のテクノロジーは、Zhipu が自社開発した「基本エージェント デカップリング中間インターフェイス」と「自己進化型オンライン コース強化学習フレームワーク」に基づいており、大規模モデル エージェントのタスク計画とアクション実行における機能の対立、トレーニング タスク、データ不足を解決します。まばらなフィードバック信号やポリシー分布のドリフトなどの問題。 AutoGLM は、人が成長の過程で新しいスキルを習得し続けるのと同じように、継続的に自らを改善し、継続的かつ着実に自身のパフォーマンスを向上させることができます。
技術的な課題としては、「アクション実行」の精度不足と「タスク計画」の柔軟性不足の問題をAutoGLMが解決します。 「基本エージェント分離中間インターフェイス」の設計により、自然言語中間インターフェイスを介して「タスク計画」と「アクション実行」の 2 つの段階を分離し、エージェントの機能の大幅な向上を実現します。同時に、AutoGLM は「自己進化型オンラインコース強化学習フレームワーク」を採用し、実際のオンライン環境における Web および電話環境の大規模モデルエージェントの能力を学習および向上させます。
AutoGLM は、電話の使用と Web ブラウザの使用の両方で大幅なパフォーマンスの向上を達成し、AndroidLab 評価ベンチマークで GPT-4o および Claude-3.5-Sonnet のパフォーマンスを上回りました。 WebArena-Lite 評価ベンチマークでは、AutoGLM は GPT-4o と比較して約 200% のパフォーマンス向上を達成し、GUI 制御における人間と大規模モデル エージェント間の成功率の差を縮めました。
プロジェクトアドレス: https://xiao9905.github.io/AutoGLM
全体として、AutoGLM の開始は、人工知能テクノロジーにおける重要な進歩を表しており、携帯電話を操作する AI の能力が向上するだけでなく、将来の知的生活にさらなる可能性をもたらします。 Downcodes の編集者は、AutoGLM の応用範囲が広がり、将来的にはさらに最適化されることを期待しています。