素晴らしいLLM駆動エージェント
大規模な言語モデル(LLM)の印象的な計画、推論、ツールを呼び出す機能のおかげで、人々はLLMを搭載したエージェントを積極的に研究および開発しています。これらのエージェントは、複雑なタスクを自律的に(そして協力して)解決したり、人間の相互作用をシミュレートすることができます。
このプロジェクトでの私たちの目標は、論文、リポジトリなどを含むLLM駆動のエージェントに関連する素晴らしいリソースの徹底的なコレクションを構築することです。これらを定期的かつ継続的に更新するよう努めています。 PR、問題、電子メール、またはその他の方法を介した貢献には、貢献を大いに評価しています。
このリポジトリはアクティブなメンテナンスを受けていないことに注意してください。主に、2023年10月以前に登場する論文が含まれており、さらにいくつかの論文が含まれています。論文を含めたい場合は、プルリクエストを開始してください。
- 論文
- 自律タスクソルバー
- 一般的な推論と計画とツールを使用
- マルチエージェント協力
- フレームワークとオープンソース
- 応用
- Webエージェント
- RLエージェント
- ロボット工学と具体化されたAI
- ゲームとロールプレイ
- その他のアプリケーション
- 信頼できる
- 人間の相互作用シミュレーション
- 人間の相互作用
- エージェント駆動のLLMS
- ベンチマーク
- 調査とチュートリアル
- オープンソースプロジェクト
- 自律タスクソルバープロジェクト
- マルチエージェントシミュレーションプロジェクト
- 視点
- その他の関連ソース
- 了承
論文
50を超える引用または200を超える星を持つリポジトリの紙の場合。
評判の高い会議/雑誌によって受け入れられた論文の場合。
自律タスクソルバー
一般的な推論と計画とツールを使用
- [2024年5月] 「学習可能な重みとして機能を備えた言語モデルエージェントのオフライントレーニング」 Shaokun Zhang(PSU)et al。 ICML 2024。[Paper] [Code]
- [2024年3月] 「エージェントフラン:大規模な言語モデル向けの効果的なエージェントチューニングのデータと方法の設計。」 Zehui Chen(USTC)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年12月] 「Clova:ツールの使用と更新を備えたクローズドループビジュアルアシスタント。」 Zhi Gao(Bigai)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年12月] 「SaycanPay:学習可能なドメイン知識を使用した大規模な言語モデルを使用したヒューリスティックな計画。」 Rishi Hazra et al。 aaai 2024 [Paper] [code] [Project Page]
- [2023年10月] 「言語エージェントツリー検索は、言語モデルの演技と計画の推論を統合します。」 Andy Zhou(UIUC)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年10月] 「大規模な言語モデルはまだ自己修正されていない。」 Jie Huang(UIUC)et al。 ICLR 2024。[紙]
- [2023年10月] 「コミュニケーションによるLLMエージェントの適応」。 Kuan Wang(Gatech&Microsoft)et al。 arxiv。 [紙]
- [2023年10月] "Toolchain*:A* search" Yuchen Zhuang(Gatech&Adobe)et al。 ICLR 2024。[紙]
- [2023年9月] 「Avis:大規模な言語モデルを使用した自律的な視覚情報」。 Ziniu Hu(Google)et al。ニューリップス2023。[紙]
- [2023年9月] 「未来の理由、今のところ行動:証明可能なサンプル効率を持つ自律LLMエージェントの原則的なフレームワーク」。 Zhihan Liu(Northwestern)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「自己主導の接地:自動言語に整合したスキル学習を備えた大規模な言語モデルエージェント。」 Shaohui Peng(CAS)et al。 arxiv。 [紙]
- [2023年8月] 「Expel:LLMエージェントは体験学習者です。」 Andrew Zhao(Thu)et al。 arxiv。 [紙]
- [2023年8月] 「堅牢なAIのための大規模な言語モデルと認知アーキテクチャの相乗的統合:探索的分析。」オスカーJ.ロメロ(CMU)et al。 arxiv。 [紙]
- [2023年8月] 「LLMによる動的計画」。 Gautier Dagan(U of Edinburgh)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「レトロフォーマー:ポリシーグラデーションの最適化を伴うレトロスペクティブな大規模な言語エージェント。」 Weiran Yao(Salesforce)et al。 arxiv。 [紙]
- [2023年5月] 「Rewoo:効率的な拡張言語モデルの観察からの推論の分離。」 Binfeng Xu et al。 arxiv。 [紙] [コード]
- [2023年5月] 「Swiftsage:複雑なインタラクティブなタスクのために高速でゆっくりと考えている生成エージェント。」ビル・ユシェン・リン(AI2)et al。 Neurips2023。[Paper] [Code] [Project Page]
- [2023年5月] 「Adaplanner:言語モデルを使用したフィードバックからの適応計画。」 Haotian Sun(Gatech)et al。 Neurips2023。[紙] [コード]
- [2022年5月] 「言語モデルとの推論は、世界モデルとの計画です。」 Shibo Hao(UCSD)et al。 EMNLP 2023。[Paper] [Code] [Project Page]
- [2023年5月] 「事前に訓練された大規模な言語モデルを活用して、モデルベースのタスク計画のために世界モデルを構築および利用します。」 Lin Guan(ASU)et al。 Neurips2023。[Paper] [Code] [Project Page]
- [2023年5月] 「チャットコット:チャットベースの大規模な言語モデルに関するツール編成の考え方の推論。」 Zhipeng Chen(Ruc)et al。 EMNLP 2023調査結果。 [紙] [コード]
- [2023年5月] 「批評家:大規模な言語モデルは、ツールインタラクティブな批評で自己修正できます。」 Zibin Gou(Thu&Microsoft)et al。 arxiv。 [紙] [コード]
- [2023年4月] 「LLM+P:最適な計画能力を持つ大規模な言語モデルの力を強化します。」 Bo Liu(UT Austin)et al。 arxiv。 [紙] [コード]
- [2023年3月] 「反射:言語補強学習を伴う言語エージェント。」ノアシン(北東部)等。 Neurips2023。[紙] [コード]
- [2022年12月] 「生成しないで、差別:言語モデルを現実世界環境に接地する提案」 Yu(OSU)et al。 ACL 2023。[Paper] [Code]
- [2022年10月] 「React:言語モデルで推論と行動を相乗的にする。」 Shunyu Yao(Princeton&Google Brain)et al。 ICLR 2023。[Paper] [code] [Project Page]
マルチエージェント協力
- [2024年8月] 「Megaagent:大規模なLLMエージェントシステムにおける自律協力のための実用的な枠組み " Qian Wang(NUS)et al。* arxiv。 [紙]
- [2024年5月] 「適合性、連絡、およびなりすまし:マルチエージェントLLMコラボレーションにおけるペルソナコンセンシュタント。」 Razan Baltaji(UIUC)et al。* arxiv。 [紙] [コード]
- [2024年4月] 「Comm:Collaborative Multi-Agent、Multi-Reasoning-Pathが複雑な問題解決を促します。」 Pei Chen(Tamu)et al。* Naacl 2024。[Paper] [Code]
- [2024年1月] 「L2MAC:大規模な言語モデル大規模なコード生成のための自動コンピューター。」 Samuel Holt(Cambridge)et al。 ICLR 2024。[Paper] [code] [Project Page]
- [2023年10月] 「大規模な言語モデルにおけるマルチエージェント調整能力の評価。」 Saaket Agashe(UCSC)et al。 arxiv。 [紙]
- [2023年10月] 「ダイナミックLLMエージェントネットワーク:エージェントチームの最適化とのLLMエージェントコラボレーションフレームワーク。」 Zijun Liu(Thu&Stanford)et al。 arxiv。 [紙] [コード]
- [2023年10月] 「LLMエージェントのコラボレーションメカニズムの調査:社会心理学の見方。」 Jintian Zhang(Zju)et al。 arxiv。 [紙] [コード]
- [2023年10月] 「Corex:マルチモデルコラボレーションを通じて、複雑な推論の境界を押し広げる。」 Qiushi Sun(Shanghai AI Lab&Nus)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「LLM留置:インタラクティブなマルチエージェントネゴシエーションゲームでLLMを評価する。」 Sahar Abdelnabi(Cispa)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「大規模な言語モデルとのスケーラブルなマルチロボットコラボレーション:集中化されたシステムまたは分散型システム?」 Yongchao Chen(Mit&Harvard)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「和解:ラウンドテーブル会議は、多様なLLMのコンセンサスを介して推論を改善します。」ジャスティン・チー・ヤオ・チェン(UNCチャペルヒル)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「Mindagent:Emergent Gaming Interaction」。 Xiaojian Ma(Bigai)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年8月] 「Proagent:大規模な言語モデルを備えた積極的な協同的AIの構築。」 Ceyao Zhang(Cuhk&PKU)et al。 arxiv。 [紙] [プロジェクトページ]
- [2023年8月] 「エージェントバース:マルチエージェントのコラボレーションを促進し、エージェントの緊急行動を探る」。 Weize Chen(Thu)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「GPT-in-the -Loop:マルチエージェントシステムの適応的意思決定」。ナタリア・ナシメント(ウータールーのu)et al。 arxiv。 [紙]
- [2023年8月] 「LLMSは論理的な誤症にどの程度影響を受けますか?」 Amirreza Payandeh(GMU&Vail Systems)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「Chateval:Multi-Agent Debateを通じてLLMベースの評価者に向けて。」 Chi-Min Chan(Thu)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「DBAとしてのLLM。」 Xuanhe Zhou(Thu)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「Gentopia:ツールを介したLLMのための共同プラットフォーム。」 Binfeng Xu et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年8月] 「Metagpt:Multi-Agent Collaborative Frameworkのメタプログラミング。」 Sirui Hong(Deepwisdom)et al。 arxiv。 [紙] [コード]
- [2023年7月] 「PRD:ピアランクとディスカッションは、大規模な言語モデルベースの評価を改善します。」 Ruosen Li(UT Dallas)et al。 arxiv。 [紙] [プロジェクトページ] [コード]
- [2023年7月] 「大規模な言語モデルにおける認知的相乗効果を解き放つ:マルチパーソナセルフコラボレーションによるタスク解決エージェント。」 Zhenhailong Wang(UIUC&MSRA)et al。 arxiv。 [紙] [コード]
- [2023年7月] 「Roco:大規模な言語モデルとの弁証法的なマルチロボットコラボレーション。」マンディ・チャオ(コロンビア)等。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年7月] 「ワイヤレスマルチエージェント生成AI:コネクテッドインテリジェンスから集団インテリジェンスまで。」 Hang Zou(Technology Innovation Institute、UAE)et al。 arxiv。 [紙]
- [2023年7月] 「大規模な言語モデルを使用して、協同組合の具体的なエージェントをモジュール式に構築します。」 Hongxin Zhang(Umass)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年6月] 「Restgpt:Restful APIを介した大規模な言語モデルと実際のアプリケーションを接続する。」 Yifan Song(PKU)et al。 arxiv。 [紙] [プロジェクトページ]
- [2023年6月] 「マルチエージェントコラボレーション:インテリジェントLLMエージェントの力の活用。」 Yashar Talebirad(Ualberta)et al。 arxiv。 [紙]
- [2023年5月] 「マルチエージェントの議論を通じて、大規模な言語モデルにおける異なる思考を奨励する。」 Tian Liang(Thu&Tencent)et al。 arxiv。 [紙] [コード]
- [2023年5月] 「ツールメーカーとしての大規模な言語モデル」。 Tianle Cai(Deepmind&Princeton)et al。 arxiv。 [紙] [コード]
- [2023年5月] 「マルチエージェントの議論による言語モデルの事実と推論の改善」 Yilun du(Mit)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年5月] 「ベイジアン知覚モデルにおける合意と統計効率。」 Yash Deshpande(MIT)et al。 arxiv。 [紙]
- [2023年5月] 「AIフィードバックからの自己プレイとコンテキスト内学習による言語モデルの交渉の改善」ヤオ・フー(エディンバラのU)et al。 arxiv。 [紙] [コード]
フレームワークとオープンソース
- [2023年10月] 「Operagents:野生の言語エージェント向けのオープンプラットフォーム。」 Tianbao Xie(HKU&Xlang Lab)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「Autoagents:自動エージェント生成のフレームワーク」。広東チェン(PKU)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「エージェント:自律言語エージェント向けのオープンソースフレームワーク」。 Wangchunshu Zhou(AI Waves)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「言語エージェント向けの認知アーキテクチャ。」セオドア・シュマーズ(プリンストン)等。 arxiv。 [紙] [レポ]
- [2023年8月] 「オートゲン:マルチエージェント会話フレームワークを介して次世代LLMアプリケーションを有効にします。」清wu et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年8月] 「Fastagency:マルチエージェントワークフローを生産に持ち込む最速の方法。」 Davor Runje et al。 [コード] [プロジェクトページ]
応用
Webエージェント
- [2023年9月] 「画面のみを見る:マルチモーダルチェーンオブアクションエージェント。」 Zhuosheng Zhang(SJTU)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「レーザー:Webナビゲーションのための状態空間探索を備えたLLMエージェント。」 Kaixin MA(Tencent)et al。 arxiv。 [紙] [コード]
- [2023年7月] 「Webarena:自律エージェントを構築するための現実的なWeb環境」 Shuyan Zhou(CMU)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年7月] 「計画、長いコンテキストの理解、プログラムの統合を備えた現実世界のウェブゲント」 Izzeddin Gur(Deepmind)et al。 arxiv。 [紙]
- [2023年6月] 「Mind2Web:Webのジェネラリストエージェントに向けて。」 Xiang deng(OSU)et al。 Neurips2023。[Paper] [Code] [Project Page]
- [2023年5月] 「大規模な言語モデルでオートテリックエージェントの増強」。 CédricOlas(Mit&Inria)et al。 arxiv。 [紙]
- [2023年5月] 「モバイルENV:LLM時代のインタラクティブエージェント向けの評価プラットフォームとベンチマーク。」 Danyang Zhang(SJTU)et al。 arxiv。 [紙] [コード]
- [2023年4月] 「大規模な言語モデルの緊急自律科学研究能力。」 Daniil A. Boiko(CMU)et al。 arxiv。 [紙]
- [2023年3月] 「言語モデルはコンピュータータスクを解決できます。」 Geunwoo Kim(UCI)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2022年7月] 「ウェブショップ:接地言語エージェントとのスケーラブルな実世界のWebインタラクションに向けて。」 Shunyu Yao(Princeton)et al。 Neurips2022。[Paper] [Code] [Project Page]
RLエージェント
- [2024年5月] 「エージェントスキルの発見」。 Xufeng Zhao(UHH)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2024年5月] 「インテリジェントゴーエクスプロール:巨大な財団モデルの肩に立っています。」 Cong Lu(UBC)et al。 arxiv。 [紙]
- [2023年11月] "Lafite-RL:"大規模な言語モデルからのフィードバックによるロボット操作の強化学習 " Kun Chu(UHH)etal。CRLWS @ corl 2023。[Paper]
- [2023年10月] 「モチーフ:人工知能のフィードバックからの本質的な動機」。 Martin Klissarov(Mila&Meta&McGill)et al。 arxiv。 [紙]
- [2023年9月] 「rladapter:オープンワールドでの学習を強化するために、大規模な言語モデルを橋渡しします。」 Wanpeng Zhang(PKU)et al。 arxiv。 [紙]
- [2023年8月] 「LAGR-seq:サンプル効率の高いクエリを使用した言語誘導補強学習。」 Thommen George Karimpanal(Deakin University)et al。 arxiv。 [紙] [コード]
- [2023年7月] 「対話の形成:NPCインタラクションを通じてエージェントの力を与える。」 Wei Zhou(Gatech)et al。 arxiv。 [紙]
- [2023年7月] 「基礎モデルを備えた統一されたエージェントに向けて」。ノーマン・ディ・パロ(ICL&ディープマインド)et al。生まれ変わりRL @ ICLR 2023。[紙]
- [2023年6月] 「大規模な言語モデルは半パラメトリック補強学習エージェントです。」 Danyang Zhang(SJTU)et al。ニューリップス2023。[紙]
- [2023年5月] 「マルチエージェント強化学習における意味的に整列したタスク分解」。 Wenhao Li(Cuhk)et al。 arxiv。 [紙]
ロボット工学と具体化されたAI
- [2024年11月] 「労働エージェント:バイマニュアルロボットを組織するための大規模な言語モデル」 、 Kun Chu(UHH)et al。ヒューマノイド2024。[紙] [ウェブサイト]、[コード]
- [2024年7月] 「オデッセイ:オープンワールドスキルを持つエージェントエージェント。」 Shunyu Liu(Zhijiang University)et al。 arxiv。 [紙] [コード]
- [2023年11月] 「レオ:3D世界で具体化されたジェネラリストエージェント」。 Xiaojian Ma(Bigai)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年11月] 「Jarvis-1:メモリが熟成したマルチモーダル言語モデルを備えたオープンワールドマルチタスクエージェント。」 Zihao Wang(PKU)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年10月] 「マルチモーダルの大手言語モデルを介したエンドツーエンドの具体化された意思決定に向けて:GPT4-Vision以降の探索。」 Liang Chen(PKU)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年10月] 「Lancar:非構造化された環境でのコンテキスト認識ロボットの移動の言語の活用。」チャック・ラム・シェク(UMD)et al。 arxiv。 [紙] [プロジェクトページ]
- [2023年9月] 「LLMグラウンド:エージェントとしての大規模な言語モデルを使用したオープンボキャブラリー3D視覚的接地。」 Jianing Yang(Umich)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「Smart-llm:大規模な言語モデルを使用したスマートマルチエージェントロボットタスク計画」。 Shyam Sundar Kannan(Purdue)et al。 arxiv。 [紙] [プロジェクトページ]
- [2023年9月] 「安全チップをプラグインする:LLM駆動型のロボットエージェントの制約の実施。」 Ziyi Yang et al。 arxiv。 [紙] [コードとビデオ]
- [2023年9月] 「Saynav:新しい環境でのナビゲーションへの動的計画のための大きな言語モデルの接地。」 Abhinav Rajvanshi(SRI International)et al。 arxiv。 [紙]
- [2023年9月] 「大規模な言語モデルによる発達足場」。 M. Batuhan Celik(Bogazici University)et al。 arxiv。 [紙]
- [2023年7月] 「3月のチャット:インタラクティブなリモート具体化された紹介式のプロンプト。」 Yanyuan Qiao(Adelaide University)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「A^2Nav:Foundationモデルのビジョンと言語の能力を活用することによるアクションアウェアゼロショットロボットナビゲーション」 Peihao Chen(Scut)et al。 arxiv。 [紙]
- [2023年7月] 「大規模な言語モデルで具体化されたタスク計画」。 Zhenyu Wu(Bupt)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年6月] 「エージェントとLLM間のインテリジェントな相互作用を可能にする:強化学習アプローチ。」 Bin Hu(Zhejiang Lab)et al。 arxiv。 [紙] [コード]
- [2023年5月] 「Minecraftの幽霊:テキストベースの知識と記憶を持つ大規模な言語モデルを介したオープンワールド環境の一般的な有能なエージェント。」 Xizhou Zhu(Thu&Sensetim)et al。 arxiv。 [紙] [コード]
- [2023年5月] 「Voyager:大規模な言語モデルを備えたオープンエンドの具体化されたエージェント」 Guanzhi Wang(Nvidia&Caltech)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年5月] 「計画、排除、追跡 - 言語モデルは、具体化されたエージェントにとって優れた教師です。」 Yue Wu(CMU)et al。 arxiv。 [紙]
- [2023年2月] 「説明、説明、計画、選択:大規模な言語モデルを使用したインタラクティブな計画により、オープンワールドのマルチタスクエージェントが可能になります。」 Zihao Wang(PKU)et al。 Neurips2023。[紙] [コード]
- [2023年2月] 「具体化された推論のために言語モデルと協力する。」石田dasgupta(deepmind)et al。 larel @ neurips2022。[紙]
- [2023年1月] 「具体化されたエージェントは、ピクセル化された羊の夢を夢見ています:言語誘導世界モデリングを使用した具体化された意思決定」コルビーノッティンガム(UCI)et al。 ICML 2023。[Paper] [Code] [Project Page]
- [2022年12月] 「LLM-Planner:大規模な言語モデルを持つ具体化されたエージェントの少数の根拠のある計画。」 Chan Hee Song(OSU)et al。 ICCV 2023。[Paper] [プロジェクトページ]
ゲームとロールプレイ
- [2024年5月] 「タイムカラ:ロールプレイングラージランゲージモデルのポイントインタイムキャラクターの幻覚の評価。」 Jaewoo Ahn(SNU)et al。 ACL 2024の調査結果。[Paper] [Code] [Project Page]
- [2023年10月] 「テキストから戦術へ:AvalonのゲームをプレイするLLMの評価。」ジョナサン・ライト(RPI)et al。 arxiv。 [紙] [コード]
- [2023年10月] 「Ruffle&Riley:会話の個別指導システムの自動誘導に向けて。」 Robin Schmucker(CMU)et al。 arxiv。 [紙]
- [2023年10月] 「アバロンの考えのゲーム:再帰的な熟考による欺ceptionとの戦い。」 Shenzhi Wang(Thu)et al。 arxiv。 [紙]
- [2023年9月] 「Mindagent:Emergent Gaming Interaction」。 Xiaojian Ma(Bigai)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「疑い - エージェント:心の理論でGPT-4の理論で不完全な情報ゲームをプレイします。」 Jiaxian Guo(U of Tokyo)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「アンビエントアドベンチャー:複雑なストーリーの開発に関するチャットグプトを教える」 Zexin Chen(Gatech)et al。 arxiv。 [紙]
- [2023年7月] 「タチクマ:大規模な言語モデルによるマルチキャラクターおよび新しいオブジェクトとの複雑な相互作用を理解する。」 Yuanzhi Liang(UTS)et al。 arxiv。 [紙]
- [2023年5月] 「大規模な言語モデルを使用したロールプレイ」。 Murray Shanahan(Deepmind&ICL)et al。 arxiv。 [紙]
- [2023年5月] 「Clembench:ゲームプレイを使用して、チャット最適化された言語モデルを会話エージェントとして評価します。」 Kranti Chalamalasetti(Potsdam大学)et al。 arxiv。 [紙] [コード]
- [2023年4月] 「自律システムに向けて:大規模な言語モデルエージェントで強化された柔軟なモジュラー生産システム。」 Yuchen Xia(シュトゥットガルト大学)et al。 arxiv。 [紙] [コード]
- [2023年3月] 「ラクダ:大規模言語モデル社会の「マインド」探索のコミュニケーションエージェント」 Guohao Li(Kaust)et al。 Neurips2023。[Paper] [Code] [Project Page]
その他のアプリケーション
- [2024年5月] 「AgentClinic:シミュレートされた臨床環境でAIを評価するためのマルチモーダルエージェントベンチマーク」 Samuel Schmidgall(Jhu&Stanford)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2024年4月] 「臨床因子:大規模な言語モデルベースの推論を伴う臨床試験マルチエージェントシステム」 Ling Yue(RPI)et al。 arxiv。 [紙] [コード]
- [2024年1月] 「Ehragent:Codeは、電子健康記録の少数の複雑な表形式の推論の大規模な言語モデルを強化します。」 Wenqi Shi(Gatech)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年10月] 「Optimus:MIPソルバーと大規模な言語モデルを使用した最適化モデリング。」 Ali Ahmaditeshnizi(Stanford)et al。 arxiv。 [紙] [コード]
- [2023年10月] 「大規模な言語モデルを使用した協同的行動に関連する人格特性の進化モデル。」 Reiji Suzuki(Nagoya University)et al。 arxiv。 [紙]
- [2023年10月] 「複数の専門家エージェントのシステムとしての大手言語モデル(LLM):抽象化と推論コーパス(ARC)課題を解決するためのアプローチ」。ジョン・チョン・ミン・タン(NUS)et al。 arxiv。 [紙]
- [2023年10月] 「正式な定理プロビングへの言語エージェントアプローチ。」 Amitayush Thakur(UT Austin)et al。 arxiv。 [紙]
- [2023年10月] 「会話の健康エージェント:パーソナライズされたLLM駆動エージェントフレームワーク。」 Mahyar Abbasian(UCI)et al。 arxiv。 [紙]
- [2023年10月] 「Oceangpt:海洋科学のタスクのための大規模な言語モデル。」 Zhen BI(Zju&Donghai Lab)et al。 arxiv。 [紙] [プロジェクトページ]
- [2023年10月] 「VIOCE2ACTION:仮想現実における効率的なリアルタイムインタラクションのエージェントとしての言語モデル。」 Yang Su(Cornell Tech)。 arxiv。 [紙]
- [2023年9月] 「Tora:数学的問題解決のためのツール統合推論エージェント」 Zibin Gou(Thu&Microsoft)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「AIを教える方法」:プログラミング教育のための教えることのできるエージェントとして大規模な言語モデルを使用します。」 Hyoungwook Jin(Kaist)et al。 arxiv。 [紙]
- [2023年9月] 「Surreldriver:大規模な言語モデルに基づいた都市コンテキストでの生成ドライバーエージェントシミュレーションフレームワークの設計。」 Ye Jin(Thu)et al。 arxiv。 [紙]
- [2023年9月] 「クリニックのエージェントとしての大規模な言語モデル」。 Nikita Mehandru(UC Berkeley)et al。 arxiv。 [紙]
- [2023年9月] 「感情的な言語モデルゲームエージェント向けの評価に基づいた移感の構造」。 Maximilian Croissant(Uoy)et al。 arxiv。 [紙]
- [2023年9月] 「LLMベースの自律エージェントを介してグラフ学習の力を解き放ちます。」 Lanning Wei(Cas&4Paradigm)et al。 arxiv。 [紙]
- [2023年9月] 「TradingGpt:階層化されたメモリと、金融取引のパフォーマンスを強化するための明確なキャラクターを備えたマルチエージェントシステム。」 Yang Li(Sit)et al。 arxiv。 [紙]
- [2023年9月] 「ModelScope-Agent:オープンソースの大型言語モデルでカスタマイズ可能なエージェントシステムを構築します。」 Chenliang Li(Alibaba)et al。 arxiv。 [紙] [コード] [デモ]
- [2023年8月] 「推奨AIエージェント:インタラクティブな推奨事項の大規模な言語モデルの統合。」 Xu Huang(USTC)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「relう:推奨のための大規模な言語モデル駆動エージェント。」 Yancheng Wang(ASU)et al。 arxiv。 [紙]
- [2023年8月] 「交通信号制御のためのLLM電動SIMからリアルへの転送」。 Longchao Da(ASU)et al。 arxiv。 [紙]
- [2023年8月] 「ケージから:サイバーセキュリティ環境で確率的オウムが勝つ方法。」マリア・リガキ(čvut)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「LLMベースのエージェントに社会的原則はありますか?」 Jitao Bai(Tju)et al。 arxiv。 [紙]
- [2023年8月] 「チェータ:EDAのための大規模な言語モデルに駆動された自律剤。」 Zhuolun He(Cuhk&Shanghai AI Lab)et al。 arxiv。 [紙]
- [2023年8月] 「ヒッチハイカーのプログラム分析ガイド:大規模な言語モデルとの旅。」 Haonan Li(UCR)et al。 arxiv。 [紙]
- [2023年6月] 「会話の大規模な言語モデルを介した自律テストエージェントに向けて」。ロバート・フェルト(チャーマーズ工科大学)et al。 arxiv。 [紙]
- [2023年4月] 「Genegpt:生物医学情報へのアクセスを改善するためのドメインツールを使用して大規模な言語モデルを増強します。」 Qiao Jin、Yifan Yang、Qingyu Chen、Zhiyong lu arxiv。 [紙] [コード]
- [2023年3月] 「Hugginggpt:chatgptとその友人とのAIタスクを抱きしめている。」 Yongliang Shen(Zju&Msra)et al。 arxiv。 [紙] [コード]
信頼できる
- [2024年2月] 「大規模な言語モデルエージェントは人間の信頼行動をシミュレートできますか?」 Xie(Kaust)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年9月] 「LM排出サンドボックスでLMエージェントのリスクを特定する」 Yangjun Ruan(トロント大学&Vector Institute)et al。 arxiv。 [紙] [コード] [デモ] [プロジェクトページ]
- [2023年8月] 「LLMベースのAIオートメーションエージェントへの信頼の強化:新しい考慮事項と将来の課題。」 Sivan Schwartz(IBM Research)et al。 Automate @ ijcai2023。[紙]
人間の相互作用シミュレーション
- [2024年3月] 「大規模な言語モデルベースのエージェント社会における社会規範の出現。」 Siyue Ren(NWPU)et al。 arxiv。 [紙] [コード]
- [2024年1月] 「オープンモデル、クローズドマインド?エージェントの能力について、オープンな大規模な言語モデルを通して人間の性格を模倣する能力。」 Lucio La Cava(カラブリア大学)et al。 arxiv。 [紙]
- [2023年10月] 「ソトピア:言語エージェントにおける社会的知性のインタラクティブ評価」 *Xuhui Zhou(CMU)et al。 *ICLR [Paper]
- [2023年10月] 「競合:大規模な言語モデルベースのエージェントにおける競争行動の理解。」 Qinlin Zhao(USTC)et al。 arxiv。 [紙]
- [2023年10月] 「大規模な言語モデルを使用して、代替ニュースフィードアルゴリズムを評価するソーシャルメディアをシミュレート」。 PetterTörnberg(U of Amsterdam)et al。 arxiv。 [紙]
- [2023年10月] 「口のある場所にお金をかける:オークションの分野でのLLMエージェントの戦略的計画と実行の評価。」 Jiangjie Chen(FDU&AI2)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年10月] 「Lyfeエージェント:低コストのリアルタイムの社会的相互作用のための生成エージェント。」 Zhao Kaiya(MIT)et al。 arxiv。 [紙]
- [2023年9月] 「LM排出サンドボックスでLMエージェントのリスクを特定する」 Yangjun Ruan(トロント大学&Vector Institute)et al。 arxiv。 [紙] [コード] [デモ] [プロジェクトページ]
- [2023年9月] 「生成エージェントベースのモデリング:メカニズムモデルと生成人工知能を結合することにより、社会システムのダイナミクスを明らかにする。」 Navid Ghaffarzadegan(Virginia Tech)et al。 arxiv。 [紙]
- [2023年8月] 「CGMI:構成可能な一般的なマルチエージェント相互作用フレームワーク」。ジンキシン・シー(ECNU)et al。 arxiv。 [紙]
- [2023年8月] 「迅速なエンジニアリングを介した大規模な言語モデルとエージェントベースのモデリングの交差点の調査。」エドワード・ジュンプルング(UCバークレー)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「Agentsims:大規模な言語モデル評価のためのオープンソースサンドボックス」。 Jiaju Lin(PTA Studio&PSU)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年7月] 「S^3:大規模な言語モデルのエージェントを持つソーシャルネットワークシミュレーションシステム。」 Chen Gao(Thu)et al。 arxiv。 [紙]
- [2023年7月] 「あなたは仮面舞踏会にいますか?オンラインソーシャルネットワークでの大規模な言語モデル主導のソーシャルボットの行動と影響を探る。」 Siyu Li(Scu)et al。 arxiv。 [紙] [データセット]
- [2023年7月] 「ソフトウェア開発のためのコミュニケーションエージェント」。 Chen Qian(Thu)et al。 arxiv。 [紙]
- [2023年7月] 「生成エージェントによる流行モデリング」。ロス・ウィリアムズ(バージニア工科大学)et al。 arxiv。 [紙] [コード]
- [2023年7月] 「Infinity and Beyond:Multi-AgentシミュレーションのShow-1およびShowrunnerエージェント」。 Philipp Maas(Fable Studio)et al。プリプリント。 [紙] [プロジェクトページ]
- [2023年6月] 「Recagent:推奨システムの新しいシミュレーションパラダイム。」 Lei Wang(Ruc)et al。 arxiv。 [紙] [コード]
- [2023年5月] 「大規模な言語モデルで繰り返しゲームをする」。 Elif Akata(U ofTübingen)et al。 arxiv。 [紙]
- [2023年5月] 「生成エージェントにおける要約の役割:予備的な視点。」 Xiachong Feng(Hit)et al。 arxiv。 [紙]
- [2023年4月] 「マルチパーティチャット:人間とモデルとのグループ設定の会話エージェント。」 Jimmy Wei(Cornell&Meta)et al。 arxiv。 [紙] [データセット] [コード]
- [2023年4月] 「生成エージェント:人間の行動のインタラクティブなシミュレーション。」ジュン・ソン・パーク(スタンフォード)et al。 arxiv。 [紙] [コード]
人間の相互作用
- [2023年10月] 「AI処理が促進される方法:LLMベースのエージェントとの共同作成の研究質問の調査方法。」 Yiren Liu(UIUC)et al。 arxiv。 [紙]
- [2023年8月] 「集団意見のダイナミクスに対する大規模な言語モデルの影響の定量化。」 Chao Li(Zju)et al。 arxiv。 [紙]
- [2023年8月] 「Sapien:大規模な言語モデルを搭載した感情的な仮想エージェント。」マスム・ハサン(u of Rochester)et al。 arxiv。 [紙]
- [2023年7月] 「精神的幸福のサポートのために大規模な言語モデルベースの会話エージェントを使用することの利点と課題を理解する」。 Zilin MA(Harvard)et al。 arxiv。 [紙]
エージェント駆動のLLMS
- [2023年10月] 「エージェントは、大規模な言語モデルに一般的なゼロショット推論者になるように指示します。」ニコラス・クリスピノ(ワシュ)等。 arxiv。 [紙] [コード]
- [2023年10月] 「β-コダー:プログラム統合のための価値ベースのディープ補強学習。」 Zishun Yu(UIC&Bytedance)et al。 arxiv。 [紙]
- [2023年5月] 「シミュレートされた人間社会における社会的に整合した言語モデルのトレーニング。」 Ruibo Liu(Dartmouth)et al。 arxiv。 [紙] [コード]
- [2023年5月] 「言語モデルは世界モデルを満たしています:具体化された経験は言語モデルを強化します。」 Jiannan Xiang(UCSD)et al。 Neurips2023。[紙] [コード]
ベンチマーク
- [2024年7月] 「AppWorld:インタラクティブコーディングエージェントのベンチマークのためのアプリと人々の制御可能な世界。」 Harsh Trivedi(Stony Brook University)et al。 ACL 2024。[Paper] [Code] [Project Page]
- [2023年12月] 「T-EVAL:大規模な言語モデルのツール利用機能の評価段階的。」 Zehui Chen(USTC、Shanghai AI Lab)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年11月] 「魔法:認知、適応性、合理性、コラボレーションにおける大規模な言語モデル駆動のマルチエージェントの調査。」 * Lin Xu et al。(Nus、Bytedance、Stanford&UC Berkeley) * Arxiv。 [紙] [プロジェクトページ]
- [2023年10月] 「自律性とアラインメントのバランス:自律LLM駆動型マルチエージェントアーキテクチャの多次元分類法。」 ThorstenHändler(Fernfh)et al。 arxiv。 [紙]
- [2023年10月] 「AIの研究エージェントとしての大規模な言語モデルのベンチマーク。」 Qian Huang(Stanford)et al。 arxiv。 [紙] [コード]
- [2023年10月] 「大規模な言語モデルのメタトールベンチマーク:ツールを使用するかどうか、どのツールを使用するかを決定します。」 Yue Huang(Lehigh University)et al。 arxiv。 [紙] [データセット]
- [2023年10月] 「SmartPlay:インテリジェントエージェントとしてのLLMSのベンチマーク。」 Yue Wu(CMU&Microsoft)et al。 arxiv。 [紙] [コード]
- [2023年9月] 「LM排出サンドボックスでLMエージェントのリスクを特定する」 Yangjun Ruan(トロント大学&Vector Institute)et al。 arxiv。 [紙] [コード] [デモ] [プロジェクトページ]
- [2023年8月] 「Bolaa:LLMの自律剤のベンチマークとオーケストレーション。」 Zhiwei Liu(Salesforce)et al。 arxiv。 [紙] [コード]
- [2023年8月] 「エージェントベンチ:エージェントとしてのLLMの評価。」 Xiao Liu(Thu)et al。 arxiv。 [紙] [コード] [プロジェクトページ]
- [2023年8月] 「TPTU:大規模な言語モデルベースのAIエージェントのタスク計画とツールの使用。」 Jingqing Ruan(Sensetime)et al。 arxiv。 [紙]
- [2023年6月] 「Toolqa:外部ツールを使用したLLM質問のデータセット。」 Yuchen Zhuang(Gatech)et al。 Neurips2023。[紙] [コード]
調査とチュートリアル
- [2023年9月] 「LLMSによる自然言語ベースのコンテキストモデリングと推論:チュートリアル。」 Haoyi Xiong(Baidu)et al。 arxiv。 [紙]
- [2023年9月] 「大規模な言語モデルベースの人工知能エージェントの詳細な調査。」 Pengyu Zhao(BJTU)et al。 arxiv。 [紙]
- [2023年9月] 「大規模な言語モデルベースのエージェントの上昇と可能性:調査。」 Zhiheng Xi(FDU)et al。 arxiv。 [紙] [github]
- [2023年8月] 「大規模な言語モデルベースの自律剤に関する調査。」 Lei Wang(Ruc)et al。 arxiv。 [紙] [github]
- [2023年3月] 「大規模な言語モデルの調査(セクション6.3-複雑なタスク解決の計画)。」ウェイン・シン・ザオ(RUC)et al。 arxiv。 [紙] [github]
オープンソースプロジェクト
自律タスクソルバープロジェクト
- Auto-GPT-GPT-4を完全に自律的にしようとする実験的なオープンソースの試み。
- ?§? LANGCHAIN -Composabilityを通じてLLMを使用したアプリケーションの構築。
- GPTエンジニア - 構築するものを指定し、AIは明確化を求め、それを構築します。
- メタグプト - ?マルチエージェントフレームワーク:1つのライン要件が与えられた場合、PRD、設計、タスク、レポを返します。
- Babyagi- AI搭載のタスク管理システム。
- L2MAC -LLM自動コンピューターフレームワーク:L2MAC
- ヤカナ - ??マルチエージェントチャットとビーリングワークフローを使用したOpenSource LLMSの電源。
マルチエージェントシミュレーションプロジェクト
- アイタウン? - AIタウンの独自のバージョンを構築およびカスタマイズするための展開可能なスターターキット - AIキャラクターがライブ、チャット、社交の仮想町。
- GPTEAM-オープンソースマルチエージェントシミュレーション。
- ? Chatarena- LLMSのマルチエージェント言語ゲーム環境。
- ?エージェントバース? - 大規模な言語モデル(LLM)のカスタムマルチエージェント環境を構築するプロセスを簡素化する柔軟なフレームワーク。
視点
- 言語エージェント:人工知能の重要な進化ステップ-Yu Su(OSU)、2023年9月5日。
- Xlangの紹介:実行可能な言語の接地を介して言語モデルエージェントを構築するためのオープンソースフレームワーク-Xlang Lab、2023年8月9日。
- GPTエージェントとは何ですか?未来のAIインターフェイスに深く潜り込む - エージェントがAI、Logan Kilpatrick(Openai)の未来の中心的な部分である理由を学び、2023年7月25日。
- デジタル世界の言語エージェント:機会とリスク-Shunyu Yao(Princeton)et al。、2023年7月24日。
- Kokomind:LLMSは社会的相互作用を理解できますか? - AIを想像してみてください。カクテルパーティーで?、Weiyan Shi(Columbia)et al。、7ul、2023
- LLM Powered Autonomous Agents -Rilian Weng(Openai)による素晴らしいブログ、2023年6月23日。
その他の関連ソース
- パーソナライズされた生成AI @ cikm'23
- LLM-Agents-Papers-LEPOには、LLMのロールプレイ、メモリメカニズム、LLMゲームプレイに関する論文がリストされています。
- LLMagentPapers- LLMSのマルチエージェントに関する必見の論文。
- Awesome-llm-Agents-素晴らしいLLMエージェントのキュレーションリスト。
了承
We greatly appreciate any contributions via PRs, issues, emails, or other methods. Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions. ❤❤️
The repository is initially built and maintained by Yupeng Hou ([email protected]).