大規模な言語モデルエージェントに関する必見の論文。
「あなたが興味を持っているかもしれない他のいくつかのペーパーリストがあります:
Prompt4Reasoningpapers:言語モデルを促進する論文を使用した推論。
? KnowledgeDitingPapers:大規模な言語モデルの知識編集に関する必見の論文。
私たちは、これらの論文やリソースのコレクションに飛び込むように心から招待します。それぞれが探検と発見の明確な旅を提供します。 ?」
インタラクティブな自然言語処理
Zekun Wang、Ge Zhang、Kexin Yang、Ning Shi、Wangchunshu Zhou、Shaochun Hao、Guangzheng Xiong、Yizhi Li、Mong Yuan Sim、Xiuying Chen、Qingqing Zhu、Zhenzhu Yang、Adam nik、Qi liu、chenghua hubo、rubo、rubo、adam nik Chen、Ke Xu、Dayiheng Liu、Yike Guo、Jie Fu。 [abs]、2023.5
大規模な言語モデルベースの自律エージェントに関する調査
Lei Wang、Chen MA、Xueyang Feng、Zeyu Zhang、Hao Yang、Jingsen Zhang、Zhiyuan Chen、Jiakai Tang、Xu Chen、Yankai Lin、Wayne Xin Zhao、Zhewei Wei、Ji-Rong Wen。 [abs]、2023.8
大規模な言語モデルベースのエージェントの上昇と可能性:調査
Zhihiheng Xi、Wenxiang Chen、Xin Guo、Wei He、Yiwen Ding、Boyang Hong、Ming Zhang、Junzhe Wang、Senjie Jin、Enyu Zhou、Rui Zheng、Xiaoranファン、Xiao王、Limao Xiong、Yuhao Zhou Zhou、Weiran wang、hiran wang、hiranwang、 Xiangyang Liu、Zhangyue Yin、Shihan Dou、Rongxiang Weng、Wensen Cheng、Qi Zhang、Wenjuan Qin、Yongyan Zheng、Xipeng Qiu、Xuanjing Huang、Tao Gui。 [abs]、2023.9
LLMがウィザードである場合、コードはワンドです。コードが大規模な言語モデルにインテリジェントエージェントとして機能する方法に関する調査
Ke Yang、Jiateng Liu、John Wu、Chaoqi Yang、Yi R. Fung、Sha Li、Zixuan Huang、Xu Cao、Xingyao Wang、Yiquan Wang、Heng Ji、Chengxiang Zhai。 [abs]、2024.1
エージェントAI:マルチモーダル相互作用の視野を調査します
Zane Durante、Qiuyuan Huang、Naoki Wake、Ran Gong、Jae Sung Park、Bidipta Sarkar、Rohan Taori、Yusuke Noda、Demetri Terzopoulos、Yejin Choi、Katsushi Ikeuchi、Hoi Vo、Li Fei Fei、Jianfeng Gao。 [abs]、2024.1
パーソナルLLMエージェント:能力、効率、セキュリティに関する洞察と調査
Yuanchun Li、Hao Wen、Weijun Wang、Xiangyu Li、Yizhen Yuan、Guohong Liu、Jiacheng Liu、Wenxing Xu、Xiang Wang、Yi Sun、Rui Kong、Yile Wang、Hanfei Geng、Jian Luan、Xuefeng Jin、Zilong Mengwei Xu、Zhijun Li、Peng Li、Yang Liu、Ya-Qin Zhang、Yunxin Liu。 [abs]、2024.1
神経コードインテリジェンスの調査:パラダイム、進歩など
Qiushi Sun、Zhirui Chen、Fangzhi Xu、Kanzhi Cheng、Chang MA、Zhangyue Yin、Jianing Wang、Chengcheng Han、Renyu Zhu、Shuai Yuan、Qipeng Guo、Xipeng Qiu、Pengcheng Yin、Xiaoliウー。 [AB]、2024.3
心の理論は大きな言語モデルで自発的に出現したかもしれません
ミカル・コシンスキー。 [abs]、2023.2
chatgptの毒性:ペルソナが割り当てられた言語モデルの分析
Ameet Deshpande、Vishvak Murahari、Tanmay Rajpurohit、Ashwin Kalyan、Karthik Narasimhan。 [AB]、2023.4
大規模な言語モデルで繰り返しゲームをプレイします
エリフ・アカタ、ライオン・シュルツ、ジュリアン・コーダ・フォルノ、ソング・ジュン・オー、マティアス・ベッジ、エリック・シュルツ。 [abs]、2023.5
ExpertPrompting:大規模な言語モデルに際立った専門家に指示する
Benfeng Xu、Yang、Junyang Lin、Quan Wang、Chang Zhou、Yongdong Zhang、Zhendong Mao。 [abs]、2023.5
大きな言語モデルを使用したロールプレイ
マレー・シャナハン、カイル・マクドネル、ラリア・レイノルズ。 [abs]、2023.5
Tidybot:大規模な言語モデルを使用したパーソナライズされたロボット支援
ジミー・ウー、リカ・アントノヴァ、アダム・カン、マリオン・レパート、アンディ・ゼン、シュラン・ソング、ジャネット・ボッグ、シモン・ルシンキヴィッツ、トーマス・ファンハウザー。 [abs]、2023.5
大規模な言語モデルの性格特性
ムスタファ・サフダリ、グレッグ・セラピオ・ガルシア、クレメント・クレーピー、スティーブン・フィッツ、ピーター・ロメロ、ルーニング・サン、マルワ・アブドゥルハイ、アレクサンドラ・ファウスト、マジャ・マタリッチ。 [abs]、2023.7
LLMSは個性を持っていますか? MBTIテストを大規模な言語モデルの驚くべき評価にする
キーーパン、ヤウェン・ゼン。 [abs]、2023.7
人工知能の意識:意識の科学からの洞察
パトリック・ブトリン、ロバート・ロング、エリック・エルモズニーノ、ヨシュア・ベンギオ、ジョナサン・バーチ、アクセル・コンスタント、ジョージ・ディーン、スティーブン・M・フレミング、クリス・フリス、Xu ji、リョタ・カナイ、コリン・クレイン、グレース・リンゼイ、マティアス・ミシェル、ムドリク、ムドリク、ムドリク、サイモン、ルフィン・ヴァンルレン。 [abs]、2023.8
文脈から外れて:LLMSでの状況認識を測定する
Lukas Berglund、Asa Cooper Stickland、Mikita Balesni、Max Kaufmann、Meg Tong、Tomasz Korbak、Daniel Kokotajlo、Owain Evans。 [abs]、2023.9
大規模な言語モデルエージェントは、人間の信頼行動をシミュレートできますか?
Xie、Canyu Chen、Feiran Jia、Ziyu Ye、Kai Shu、Adel Bibi、Ziniu Hu、Philip Torr、Bernard Ghanem、Guohao Li。 [AB]、2024.02
COLT5:条件付き計算により、より高速な長距離トランス
ジョシュア・アインズリー、タオ・レイ、ミシエル・デ・ジョン、サンティアゴ・オンタニョン、シッダルタ・ブラフマ、Yury Zemlyanskiy、David Uthus、Mandy Guo、James Lee-Thorp、Yi Tay、Yun-Hsuan Sung、Sumit Sanghai。 [abs]、2023.3
大規模な言語モデルにおける緊急で予測可能な暗記
Stella Biderman、USVSN Sai Prashanth、Lintang Sutawika、Hailey Schoelkopf、Quentin Anthony、Shivanshu Purohit、Edward Raff。 [AB]、2023.4
自己制御メモリシステムを使用して、大規模な言語モデルの無限の長さの入力容量を解き放つ
Xinnian Liang、Bing Wang、Hui Huang、Shuangzhi Wu、Peihao Wu、Lu Lu、Zejun MA、Zhoujun Li。 [AB]、2023.4
ChatLog:時間を越えてChatGptの記録と分析
Shangqing Tu、Chunyang Li、Jifan Yu、Xiaozhi Wang、Lei Hou、Juanzi Li。 [AB]、2023.4
自己意識で推論し、暗記することを学ぶ
ジャック・ランチャンティン、シュバム・トスニワル、ジェイソン・ウェストン、アーサー・スズラム、セインバヤール・スフバター。 [abs]、2023.5
Unlimiformer:無制限の長さの入力を備えた長距離トランス
アマンダ・バーツ、ウリ・アロン、グラハム・ノイビグ、マシュー・R・ゴームリー。 [abs]、2023.5
小さなモデルは、大規模な言語モデル向けの貴重なプラグインです
Canwen Xu、Yichong Xu、Shuohang Wang、Yang Liu、Chenguang Zhu、Julian McAuley。 [abs]、2023.5
MemoryBank:長期的なメモリで大きな言語モデルを強化します
ワンジュン・チャン、リアンゴン・グオ、Qiqi Gao、彼、Yanlin Wang。 [abs]、2023.5
ToolKengpt:ツール埋め込みを介して大規模なツールを使用して凍結言語モデルを増強する
Shibo Hao、Tianyang Liu、Zhen Wang、Zhiting Hu。 [abs]、2023.5
RecurRentGpt:(任意の)長いテキストのインタラクティブ生成
Wangchunshu Zhou、Yuchen Eleanor Jiang、Peng Cui、Tiannan Wang、Zhenxin Xiao、Yifan Hou、Ryan Cotterell、Mrinmaya Sachan。 [abs]、2023.5
RET-LLM:大規模な言語モデルの一般的な読み取りろう記憶に向けて
Ali Modarressi、Ayyoob Imani、Mohsen Fayyaz、HinrichSchütze。 [abs]、2023.5
文脈を圧縮するために言語モデルを適応させます
アレクシス・シュヴァリエ、アレクサンダー・ウェッティグ、アニルド・アジス、ダンキ・チェン。 [abs]、2023.5
並列コンテキストウィンドウの再訪:イライラするほど単純な代替と考え方の劣化
Kejuan Yang、Xiao Liu、Kaiwen Men、Aohan Zeng、Yuxiao Dong、Jie Tang。 [abs]、2023.5
ランドマークの注意:変圧器のランダムアクセス無限コンテキスト長
Amirkeivan Mohtashami、Martin Jaggi。 [abs]、2023.5
ランダム化された位置エンコーディングは、変圧器の長さの一般化を強化します
Anian Ruoss、GrégoireDelétang、Tim Genewein、Jordi Grau-Moya、RóbertCsordás、Mehdi Bennani、Shane Legg、Joel Veness。 [abs]、2023.5
長さの一般化のための単調位置の注意
Jishnu Ray Chowdhury、Cornelia Caragea。 [abs]、2023.5
chatdB:象徴的なメモリとしてデータベースを使用してLLMSを拡張します
Chenxu Hu、Jie Fu、Chenzhuang Du、Simian Luo、Junbo Zhao、Hang Zhao。 [abs]、2023.6
言語エージェントの認知アーキテクチャ
セオドア・シュマーズ、シュヌ・ヤオ、カルティク・ナラシムハン、トーマス・L・グリフィス[ABS]、2023.9
Jarvis-1:メモリが熟成したマルチモーダル言語モデルを備えたオープンワールドマルチタスクエージェント
Zihao Wang、Shaofei Cai、Anji Liu、Yonggang Jin、Jinbing Hou、Bowei Zhang、Haowei Lin、Zhaofeng HE、Zilong Zheng、Yaodong Yang、Xiaojian Ma、Yitao Liang [abs]、2023.11
大規模な言語モデルベースのエージェントのメモリメカニズムに関する調査
Zeyu Zhang、Xiaohe Bo、Chen MA、Rui Li、Xu Chen、Quanyu Dai、Jieming Zhu、Zhenhua Dong、Ji-Rong Wen 。 [AB]、2024.4
Hipporag:大規模な言語モデルの神経生物学的にインスピレーションを与えました
BernalJiménezGutiérrez、Yiheng Shu、Yu Gu、Michiro Yasunaga、Yu Su。 [AB]、2024.5
思考のバッファー:大規模な言語モデルを使用した考え方の推論
Ling Yang、Zhaochen Yu、Tianjun Zhang、Shiyi Cao、Minkai Xu、Wentao Zhang、Joseph E. Gonzalez、Bin Cui。 [ABS]、2024,6
ゼロショットプランナーとしての言語モデル:具体化されたエージェントのための実用的な知識を抽出する
ウェンロングファン、ピーターアブビール、ディーパックパタック、イゴールモルダッチ。 [AB]、2022.1
内側の独白:言語モデルでの計画を通じて具体化された推論
ウェンロン・ファン、フェイ・シア、テッド・シアオ、ハリス・チャン、ジャッキー・リアン、ピート・フィレンツェ、アンディ・ゼン、ジョナサン・トンプソン、イゴール・モルダッチ、イェフゲン・チェボタール、ピエール・セルマネット、ノア・ブラウン、トマス・ジャクソン、リンダ・ルー、セルジー・レビン、カロル・ハウズマン、 [AB]、2022.7
React:言語モデルでの相乗効果と行動
Shunyu Yao、Jeffrey Zhao、Dian Yu、Nan Du、Izhak Shafran、Karthik Narasimhan、Yuan Cao。 [AB]、2022.10
Mind's Eye:シミュレーションを通じて根拠のある言語モデルの推論
Ruibo Liu、Jason Wei、Shixiang Shane Gu、Te-Yen Wu、Soroush Vosoughi、Claire Cui、Denny Zhou、Andrew M. Dai。 [AB]、2022.10
LLM-Planner:大規模な言語モデルを持つ具体化されたエージェントの少数の根拠のある計画
チャン・ヒー・ソング、ジャマン・ウー、クレイトン・ワシントン、ブライアン・M・サドラー、ウェイ・ラン・チャオ、Yu Su 。 [abs]、2022.12
生成しないで、差別しないでください:言語モデルを実際の環境に接地する提案
Yu Gu、Xiang Deng、Yu Su。 [abs]、2022.12
具体化されたエージェントはピクセル化された羊の夢を夢見ていますか?:言語ガイド付きワールドモデリングを使用した具体化された意思決定
コルビー・ノッティンガム、プリスビラ・アンマナブロル、アラン・スー、イェジン・チョイ、ハンナネ・ハジシルツィ、サミャー・シン、ロイ・フォックス。 [abs]、2023.1
説明、説明、計画、および選択:大規模な言語モデルを使用したインタラクティブな計画をオープンワールドマルチタスクエージェントが可能にします
Zihao Wang、Shaofei Cai、Anji Liu、Xiaojian MA、Yitao Liang 。 [abs]、2023.2
Palm-E:具体化されたマルチモーダル言語モデル
ダニー・ドライス、フェイ・シア、メハ・ス・サジャディ、コーリー・リンチ、アカンシャ・チョウドヘリー、ブライアン・イクター、アイザーン・ワヒド、ジョナサン・トンプソン、クアン・ヴオン、ティアンヘ・YU、ウェンロング・ファン、Yevgen Chebotar、Yevgen Sermanet、Danime leageworth、ヴァンホッケ、カロル・ハウスマン、マーク・トゥーサン、クラウス・グレフ、アンディ・ゼン、イゴール・モルダッチ、ピート・フィレンツェ。 [abs]、2023.3
反射:口頭での強化学習を伴う言語エージェント
ノア・シン、フェデリコ・カッサーノ、ベック・ラバッシュ、アシュウィン・ゴピナート、カルティク・ナラシムハン、shunyu yao。 [abs]、2023.3
環境とのチャット:大規模な言語モデルを使用したインタラクティブなマルチモーダル認識
Xufeng Zhao、Mengdi Li、Cornelius Weber、Muhammad Burhan Hafez、Stefan Wermter 。 [abs]、2023.3
Plan4MC:オープンワールドMinecraftタスクのスキル強化学習と計画
Haoqi Yuan、Chi Zhang、Hongcheng Wang、Feiyang Xie、Penglin Cai、Hao Dong、Zongqing Lu。 [abs]、2023.3
自己復活:セルフフィードバックによる反復洗練
アマン・マダン、ニケト・タンドン、プラハル・グプタ、スカイラー・ハリナン、ルユ・ガオ、サラ・ウィグレフェ、ウリ・アロン、ヌハ・ジリ、シリマイ・プラブモイ、Yiming Yang、Shashank Gupta、Bodhisattwa Prasadumder、Katherine Hermannクラーク。 [abs]、2023.3
大規模な言語モデルを自己非難に教える
Xinyun Chen、Maxwell Lin、NathanaelSchärli、Denny Zhou。 [AB]、2023.4
wizardlm:複雑な指示に従うように大規模な言語モデルを強化します
Can Xu、Qingfeng Sun、Kai Zheng、Xiubo Geng、Pu Zhao、Jiazhan Feng、Chongyang Tao、Daxin Jiang。 [AB]、2023.4
Frugalgpt:コストを削減し、パフォーマンスを改善しながら大規模な言語モデルを使用する方法
Lingjiao Chen、Matei Zaharia、James Zou。 [abs]、2023.5
思考の木:大規模な言語モデルを使用した意図的な問題解決
Shunyu Yao、Dian Yu、Jeffrey Zhao、Izhak Shafran、Thomas L. Griffiths、Yuan Cao、Karthik Narasimhan。 [abs]、2023.5
計画、排除、追跡 - 言語モデルは具体化されたエージェントにとって優れた教師です
Yue Wu、So Yeon Min、Yonatan Bisk、Ruslan Salakhutdinov、Amos Azaria、Yuanzhi Li、Tom Mitchell、Shrimai Prabhumoye 。 [abs]、2023.5
インタラクティブなテキストゲームのための知識強化エージェント
Prateek Chhikara、Jiarui Zhang、Filip Ilievski、Jonathan Francis、Kaixin MA。 [abs]、2023.5
Voyager:大規模な言語モデルを備えたオープンエンドの具体化されたエージェント
Guanzhi Wang、Yuqi Xie、Yunfan Jiang、Ajay Mandlekar、Chaowei Xiao、Yuke Zhu、Linxi Fan、Anima Anandkumar 。 [abs]、2023.5
SwiftSage:複雑なインタラクティブなタスクを迅速かつゆっくりと考えている生成エージェント
ビル・ユシェン・リン、イシェン・フー、カリーナ・ヤン、プリスヴィラジ・アンマナブロル、フェーズ・ブラフマン、聖yu huang、チャンドラ・バガヴァトゥーラ、Yejin Choi、Xiang Ren。 [abs]、2023.5
言語モデルは世界モデルを満たす:具体化された体験が言語モデルを強化する
Jiannan Xiang、Tianhua Tao、Yi Gu、Tianmin Shu、Zirui Wang、Zichao Yang、Zhiting Hu。 [abs]、2023.5
Ghost in the Minecraft:テキストベースの知識とメモリを備えた大規模な言語モデルを介したオープンワールド環境の一般的に有能なエージェント
Xizhou Zhu、Yuntao Chen、Hao Tian、Chenxin Tao、Weijie SU、Chenyu Yang、Gao Huang、Bin Li、Lewei Lu、Xiaogang Wang、Yu Qiao、Zhaoxiang Zhang、Jifeng Dai。 [abs]、2023.5
Adaplanner:言語モデルを使用したフィードバックからの適応計画
Haotian Sun、Yuchen Zhuang、Lingkai Kong、Bo Dai、Chao Zhang。 [abs]、2023.5
言語モデルの推論は、世界モデルを計画しています
Shibo Hao、Yi Gu、Haodi MA、Joshua Jiahua Hong、Zhen Wang、Daisy Zhe Wang、Zhiting Hu。 [abs]、2023.5
計画と解決のプロンプト:大規模な言語モデルによるゼロショットチェーンの推論の改善
Lei Wang、Wanyu Xu、Yihuai Lan、Zhiqiang Hu、Yunshi Lan、Roy Ka-Wei Lee、Ee-Peng Lim。 [abs]、2023.5
エージェントとLLM間のインテリジェントな相互作用を可能にする:強化学習アプローチ
Bin Hu、Chenyang Zhao、Pu Zhang、Zihao Zhou、Yuanhang Yang、Zenglin Xu、Bin Liu。 [abs]、2023.6
Recagent:推奨システムの新しいシミュレーションパラダイム
Lei Wang、Jingsen Zhang、Xu Chen、Yankai Lin、Ruihua Song、Wayne Xin Zhao、Ji-Rong Wen。 [abs]、2023.6
基礎モデルを備えた統一エージェントに向けて。
ノーマン・ディ・パロ、アルンクマール・バイラヴァン、レナード・ハセンバー、マルクス・ウルフマイヤー、ニコラス・ヒース、マーティン・リードミラー。 [abs]、2023.7
Pangu-coder2:ランキングフィードバックを伴うコードの大規模な言語モデルを増やす
Bo Shen、Jiaxin Zhang、Taihong Chen、Daoguang Zan、Bing Geng、An Fu、Muhan Zeng、Ailun Yu、Jichuan Ji、Jingyang Zhao、Yuenan Guo、Qianxiang Wang。 [abs]、2023.7
計画、長いコンテキストの理解、プログラムの統合を備えた現実世界のウェブゲント
Izzeddin Gur、Hiroki Furuta、Austin Huang、Mustafa Safdari、Yutaka Matsuo、Douglas Eck、Aleksandra Faust。 [abs]、2023.7
Retroformer:ポリシーグラデーションの最適化を備えたレトロスペクティブな大手言語エージェント
Weiran Yao、Shelby Heinecke、Juan Carlos Niebles、Zhiwei Liu、Yihao Feng、Le Xue、Rithesh Murthy、Zeyuan Chen、Jianguo Zhang、Devansh Arpit、Ran Xu、Phil Mui、Huan Wang、Caiming、Caimg、Silvio Savarese。 [abs]、2023.8
セルフチェック:LLMSを使用してゼロショット自分のステップバイステップの推論を確認する
ning miao、yee whye teh、Tom Rainforth。 [abs]、2023.8
Expel:LLMエージェントは体験学習者です
Andrew Zhao、Daniel Huang、Quentin Xu、Matthieu Lin、Yong-Jin Liu、Gao Huang。 [abs]、2023.8
自己主導の接地:自動言語に整合したスキル学習を備えた大規模な言語モデルエージェント
Shaohui Peng、Xing Hu、Qi Yi、Rui Zhang、Jiaming Guo、Di Huang、Zikang Tian、Ruizhi Chen、Zidong Du、Qi Guo、Yunji Chen、Ling Li。 [abs]、2023.9
Jarvis-1:メモリが熟成したマルチモーダル言語モデルを備えたオープンワールドマルチタスクエージェント
Zihao Wang、Shaofei Cai、Anji Liu、Yonggang Jin、Jinbing Hou、Bowei Zhang、Haowei Lin、Zhaofeng HE、Zilong Zheng、Yaodong Yang、Xiaojian Ma、Yitao Liang [abs]、2023.11
レオ:3D世界で具体化されたジェネラリストエージェント
Jiangyong Huang、Silong Yong、Xiaojian MA、Xiongkun Linghu 、Puhao Li、Yan Wang、Qing Li、Song-Chun Zhu、Baoxiong Jia、Siyuan Huang* [abs]、2023.11111111111111111111111111111111111111111111111111111111111111
コードのチェーン:言語モデルの高級コードエミュレーターを使用した推論
Chengshu Li、Jacky Liang、Andy Zeng、Xinyun Chen、Karol Hausman、Dorsa Sadigh、Sergey Levine、Li Fei-Fei、Fei Xia、Brian Ichter。 [abs]、2023.12
REST MEETS REACT:Multi-Step Reasoning LLMエージェントの自己改善
レナト・アクソフ、ソバン・ミリョーゼフィ、ゾンリン・リー、ダリアン・リー、シーラ・ババヤン、カヴィア・コプパラプ、ザカリー・フィッシャー、ルイキ・グオ、ズーシャント・プラカシュ、プラネシュ・スリニバサン、マンジル・ザヒール、フェリックス・ユ、サンジブ・クマール。 [abs]、2023.12
自制心:一貫性のない解決視点によるより良い反省
Wenqi Zhang、Yongliang Shen、Linjuan Wu、Qiuing Peng、Jun Wang、Yueting Zhuang、Weiming Lu。 [AB]、2024.01
AutoAct:自動プランニングを介してゼロから学習する自動エージェント
Shuofei Qiao、Ningyu Zhang、Runnan Fang、Yujie Luo、Wangchunshu Zhou、Yuchen Eleanor Jiang、Chengfei LV、Huajun Chen。 [AB]、2024.01
TravelPlanner:言語エージェントとの現実世界計画のベンチマーク
Jian Xie、Kai Zhang、Jiangjie Chen、Tinghui Zhu、Renze Lou、Yuandong Tian、Yanghua Xiao、Yu Su。 [AB]、2024.02
エージェント-Pro:ポリシーレベルの反射と最適化を介して進化することを学ぶ
Wenqi Zhang、Ke Tang、Hai Wu、Mengna Wang、Yongliang Shen、Guiyang Hou、Zeqi Tan、Peng Li、Yueting Zhuang、Weiming Lu。 [AB]、2024.02
KnowAgent:LLMベースのエージェントの知識補強計画
Yuqi Zhu、Shuofei Qiao、Yixin OU、Shumin Deng、Ningyu Zhang、Shiwei Lyu、Yue Shen、Lei Liang、Jinjie Gu、Huajun Chen。 [ABS]、2024.03
Sotopia-π:社会的にインテリジェントな言語エージェントのインタラクティブな学習
Ruiyi Wang、Haofei Yu、Wenxin Zhang、Zhengyang Qi、Maarten Sap、Graham Neubig、Yonatan Bisk、Hao Zhu。 [ABS]、2024.03
Autoguide:大規模な言語モデルエージェント向けの国家認識ガイドラインの自動生成と選択
ヤオ・フー、ドンキ・キム、ジェキオム・キム、サンスグリュル・ソン、ラジャヌゲン・ロゲスワラン、キュングーン・ベー、ホンラック・リー。 [ABS]、2024.03
アクション学習を通じて大規模な言語モデルエージェントに力を与えます
Haiteng Zhao、Chang MA、Guoyin Wang、Jing Su、Lingpeng Kong、Jingjing Xu、Zhi-Hong Deng、Hongxia Yang。 [AB]、2024.02
悪魔の支持者:LLMエージェントの予測的反省
Haoyu Wang、Tao Li、Zhiwei Deng、Dan Roth、Yang Li。 [abs]、2024.05
世界知識モデルを使用したエージェント計画
Shuofei Qiao、Runnan Fang、Ningyu Zhang、Yuqi Zhu、Xiang Chen、Shumin Deng、Yong Jiang、Pengjun Xie、Fei Huang、Huajun Chen。 [abs]、2024.05
インテリジェントゴーエクスプロール:巨大な基礎モデルの肩に立っている
Cong Lu、Shengran Hu、Jeff Clune。 [abs]、2024.05
象徴的なチェーンを介した忠実な論理的推論
Jundong Xu、Hao Fei、Liangming Pan、Qian Liu、Mong-Li Lee、Wynne Hsu。 [abs]、2024.05
不思議の国のアリス:最先端の大規模な言語モデルの完全な推論の内訳を示す簡単なタスク
Marianna Nezhurina、Lucia Cipolina-Kun、Mehdi Cherti、Jenia Jitsev。 [abs]、2024.06
テキスト:テキストによる自動「差別化」
Mert Yuksekgonul、Federico Bianchi、Joseph Boen、Sheng Liu、Zhi Huang、Carlos Guestrin、James Zou。 [abs]、2024.06
シンボリック学習により、自己進化エージェントが可能になります
Wangchunshu Zhou、Yixin OU、Shengwei Ding、Long Li、Jialong Wu、Tiannan Wang、Jiamin Chen、Shuai Wang、Xiaohua Xu、Ningyu Zhang、Huajun Chen、Yuchen Eleanor Jiang。 [abs]、2024.06
OS-Copilot:自己改善を伴うジェネラリストのコンピューターエージェントに向けて
Zhiyong Wu、Chengcheng Han、Zichen Ding、Zhenmin Weng、Zhoumianze Liu、Shunyu Yao、Tao Yu、Lingpeng Kong。 [AB]、2024.02
SeeClick:高度な視覚GUIエージェントのGUI接地を活用します
カンジェン、Qiushi Sun、Yougang Chu、Fangzhi Xu、Yantao Li、Jianbing Zhang、Zhiyong Wu。 [AB]、2024.01
WebGPT:人間のフィードバックを使用したブラウザ支援の質問
レイチーロ・ナカノ、ジェイコブ・ヒルトン、オシル・バラジ、ジェフ・ウー、ロング・オヤン、クリスティーナ・キム、クリストファー・ヘッセ、シャンタヌ・ジャイン、ヴィネット・コサラジュ、ウィリアム・サンダース、Xu江、カール・コブ、ティナ・エロウンド、グレッチェン・クルーガー、ケビン・ボタン、ベナイ、マタイ・ボタン。 [abs]、2021.12
ツールフォーマー:言語モデルは、ツールを使用するように自分自身を教えることができます
ティモ・シック、ジェーン・ドワイヴィーティ、ロベルト・デスシュ、ロベルタ・レールアン、マリア・ロメリ、ルーク・ゼトルモイヤー、ニコラ・カンセドダ、トーマス・サイロム。 [abs]、2023.2
MM反応:マルチモーダルの推論とアクションのCHATGPTのプロンプト
Zhengyuan Yang、Linjie Li、Jianfeng Wang、Kevin Lin、Ehsan Azarnasab、Faisal Ahmed、Zicheng Liu、Ce Liu、Michael Zeng、Lijuan Wang。 [abs]、2023.3
hugginggpt:hugging faceのchatgptとその友達とのAIタスクを解決する
Yongliang Shen、Kaitao Song、Xu Tan、Dongsheng Li、Weiming Lu、Yueting Zhuang。 [abs]、2023.3
VisualChatGpt:Visual Foundationモデルとの会話、描画、編集
Chenfei Wu、Shengming Yin、Weizhen Qi、Xiaodong Wang、Zecheng Tang、Nan Duan。 [abs]、2023.3
アート:大規模な言語モデルの自動マルチステップ推論とツール使用
Bhargavi Paranjape、Scott Lundberg、Sameer Singh、Hannaneh Hajishirzi、Luke Zettlemoyer、Marco Tulio Ribeiro。 [abs]、2023.3
TaskMatrix.ai:ファンデーションモデルを何百万ものAPIに接続することでタスクを完了します
Yaobo Liang、Chenfei Wu、Ting Song、Wenshan Wu、Yan Xia、Yu Liu、Yang OU、Shuai Lu、Lei Ji、Shaoguang Mao、Yun Wang、Linjun Shou、Ming Gong、Nan Duan。 [abs]、2023.3
Chameleon:大規模な言語モデルを使用したプラグアンドプレイ構成の推論
パン・ルー、バオリン・ペン、ハオ・チェン、ミシェル・ギャレー、カイ・ウェイ・チャン、イン・ニアン・ウー、ソンチョン・Zhu、Jianfeng Gao。 [AB]、2023.4
Chemcrow:化学ツールを使用した大規模な言語モデルを増強します
Andres M Bran、Sam Cox、Andrew D White、Philippe Schwaller。 [AB]、2023.4
タルム:ツール拡張言語モデル
アーロン・パリシ、ヤオ・ザオ、ノア・フィーデル。 [AB]、2022.5
批評家:大規模な言語モデルは、ツール相性的な批評で自己修正できます
Zibin Gou、Zhihong Shao、Yeyun Gong、Yelong Shen、Yujiu Yang、Minlie Huang、Nan Duan、Weizhu Chen。 [abs] [code]、2023.5
実行フィードバックを備えた言語モデルをより優れたツール学習者にする
Shuofei Qiao、Honghao Gui、Huajun Chen、Ningyu Zhang。 [abs]、2023.5
ChatCot:チャットベースの大型言語モデルに関するツールの熟成されたチェーンの推論
Zhipeng Chen、Kun Zhou、Beichen Zhang、Zheng Gong、Wayne Xin Zhao、Ji-Rong Wen。 [abs]、2023.5
Gorilla:大規模なAPIに接続された大きな言語モデル
Shishir G. Patil、Tianjun Zhang、Xin Wang、Joseph E. Gonzalez。 [abs]、2023.5
toolllm:16000以上の現実世界のAPIをマスターするための大きな言語モデルを促進する
Yujia Qin、Shihao Liang、Yining Ye、Kunlun Zhu、Lan Yan、Yaxi Lu、Yankai Lin、Xin Cong、Xiangru Tang、Bill Qian、Sihan Zhao、Runchu Tian、Ruobing Xie、Jie Zhou、Mark Gerstein、Dahai Li、Zhiyuan [abs]、2023.7
ギア:一般化可能で効率的なツール解像度で言語モデルを増強する
Yining Lu、Haoping Yu、Daniel Khashabi。 [abs]、2023.7
Gentopia:ツールを得たLLMSの共同プラットフォーム
Binfeng Xu、Xukun Liu、Hua Shen、Zeyu Han、Yuhan Li、Murong Yue、Zhiyuan Peng、Yuchen Liu、Ziyu Yao、Dongkuan Xu。 [abs]、2023.8
LM排出サンドボックスでLMエージェントのリスクを特定する
Yangjun Ruan、Honghua Dong、Andrew Wang、Silviu Pitis、Yongchao Zhou、Jimmy BA、Yann Dubois、Chris J. Maddison、Tatsunori Hashimoto。 [abs]、2023.9
モデルベースのタスク計画のために世界モデルを構築および利用するために、事前に訓練された大手言語モデルを活用する
Lin Guan、Karthik Valmeekam、Sarath Sreedharan、Subbarao Kambhampati [abs]、2023.5
データコピロット:数十億のデータと人間を自律的なワークフローで埋める
Wenqi Zhang、Yongliang Shen、Weiming Lu、Yueting Zhuang [abs]、2023.6
CLOVA:ツールの使用と更新を備えたクローズドループビジュアルアシスタント
Zhi Gao、Yuntao du、Xintong Zhang、Xiaojian MA、Wenjuan Han、Song-Chun Zhu、Qing Li [abs]、2023.12
Gitagent:ツール拡張によりGithubを使用して自律剤を促進します
ボハン・リュウ、シン・コング、ヘイアン・ユ、パン・ヤン、ユジア・チン、イーインチー・イー、ヤクシ・ルー、Zhong Zhang、Yukun Yan、Yankai Lin、Zhiyuan Liu、Maosong Sun. [abs]、2023.12
EasyTool:簡潔なツール命令でLLMベースのエージェントを強化します
Siyu Yuan、Kaitao Song、Jiangjie Chen、Xu Tan、Yongliang Shen、Kan Ren、Dongsheng Li、Deqing Yang。 [abs]、2024.1
Symbol-llm:大規模な言語モデルの基礎シンボル中心のインターフェイスに向けて
Fangzhi Xu、Zhiyong Wu、Qiushi Sun、Siyu Ren、Fei Yuan、Shuai Yuan、Qika Lin、Yu Qiao、Jun Liu。 [abs]、2023.11
チューリップエージェント - LLMベースのエージェントが大規模なツールライブラリを使用してタスクを解決できるようにする
Felix Ocker、Daniel Tanneberg、Julian Eggert、Michael Gienger。 [abs]、2024.07
OneGen:LLMSの効率的なワンパス統合生成と検索
Jintian Zhang、Cheng Peng、Mengshu Sun、Xiang Chen、Lei Liang、Zhiqiang Zhang、Jun Zhou、Huajun Chen、Ningyu Zhang。 [abs]、2024.09
言語モデルのカスケード
デビッド・ドーハン、ウィニー・Xu、エイター・ルーコウィッツ、ジェイコブ・オースティン、デビッド・ビーバー、ラファエル・ゴンティホ・ロペス、ユハイ・ウー、ヘンリック・ミシェルスキー、リフ・A・ザウアス、ジャシャー・ソー・ドリックスタイン、ケビン・マーフィー、チャールズ・サットン。 [AB]、2022.7
具体化された推論のために言語モデルと協力します
石田・ダスグプタ、クリスティン・ケーザー・チェン、ケネス・マリノ、アルン・アフジャ、シーラ・ババヤン、フェリックス・ヒル、ロブ・ファーガス。 [abs]、2023.2
キャメル:大規模な言語モデル社会の「マインド」探索のためのコミュニケーションエージェント
Guohao Li、Hasan Abed Al Kader Hammoud、Hani Itani、Dmitrii Khizbullin、Bernard Ghanem。 [abs]、2023.3
マルチパーティチャット:人間とモデルとのグループ設定での会話エージェント
ジミー・ウェイ、カート・シャスター、アーサー・スズラム、ジェイソン・ウェストン、ジャック・アーバネク、モジュタバ・コメリ。 [AB]、2023.4
Chatllmネットワーク:より多くの脳、より多くの知性
Rui Hao、Linmei Hu、Weijian Qi、Qingliu Wu、Yirui Zhang、Liqiang Nie。 [AB]、2023.4
CHATGPT経由のセルフコラボレーションコード生成
Yihong Dong、Xue Jiang、Zhi Jin、Ge Li。 [AB]、2023.4
大規模な言語モデルの緊急自律科学研究能力
Daniil A. Boiko、Robert Macknight、Gabe Gomes。 [AB]、2023.4
ナレッジグラフの構築と推論のためのchatgpt/gpt-4:最近の能力と将来の機会
Yuqi Zhu、Xiaohan Wang、Jing Chen、Shuofei Qiao、Yixin OU、Yunzhi Yao、Shumin Deng、Huajun Chen、Ningyu Zhang。 [abs]、2023.5
ツールメーカーとしての大規模な言語モデル
Tianle Cai、Xuzhi Wang、Tengyu MA、Xinyun Chen、Denny Zhou 。 [abs]、2023.5
アクションや指示からエージェントを通信する目標を推測する
Lance Ying、Tan Zhi-Xuan、Vikash Mansinghka、Joshua B. Tenenbaum。 [abs]、2023.6
ワイヤレスマルチエージェント生成AI:接続されたインテリジェンスから集団インテリジェンスまで
ハングゾウ、Qiyang Zhao、Lina Bariah、Mehdi Bennis、Merouane Debbah。 [abs]、2023.7
ROCO:大規模な言語モデルとの弁証法的なマルチロボットコラボレーション
Zhao Mandi、Shreeya Jain、Shuran Song。 [abs]、2023.7
大規模な言語モデルでの認知相乗効果を解き放つ:マルチパーソナの自己コラボレーションによるタスク解決エージェント
Zhenhailong Wang、Shaoguang Mao、Wenshan Wu、Tao Ge、Furu Wei、Heng Ji。 [abs]、2023.7
ソフトウェア開発のためのコミュニケーションエージェント
チェン・チアン、シン・コング、チェン・ヤン、ワイズ・チェン、ユシェン・ス、ジュユアンXU、Zhiyuan Liu、Maosong Sun。 [abs]、2023.7
Infinity and Beyondへ:マルチエージェントシミュレーションのShow-1およびShowrunnerエージェント
フィリップ・マース、フランク・キャリー、クリス・ウィーラー、エドワード・サーチ、ピート・ビリントン、ジェシカ・ヤファ・シャマシュ。 [abs]、2023.7
Metagpt:マルチエージェントコラボレーションフレームワーク向けのメタプログラミング
Sirui Hong、Xiawu Zheng、Jonathan Chen、Yuheng Cheng、Ceyao Zhang、Zili Wang、Steven Ka Shing Yau、Zijuan Lin、Liyang Zhou、Chenyu Ran、Lingfeng Xiao、Chenglin Wu。 [abs]、2023.8
AIフィードバックからの自己プレイとコンテキスト内学習との言語モデルの交渉の改善
Yao Fu、Hao Peng、Tushar Khot、Mirella Lapata。 [abs]、2023.5
マルチエージェントコラボレーション:インテリジェントLLMエージェントの力を活用します
Yashar Talebirad、Amirhossein nadiri。 [abs]、2023.6
RESTGPT:RESTFUL APIを介して、大規模な言語モデルと実際のアプリケーションを接続する
Yifan Song、Weimin Xiong、Dawei Zhu、Cheng Li、Ke Wang、Ye Tian、Sujian Li 。 [abs]、2023.6
大規模な言語モデルを使用して、協同組合具体化エージェントをモジュール型に構築します
Hongxin Zhang、Weihua du、Jiaming Shan、Qinhong Zhou、Yilun du、Joshua B. Tenenbaum、Tianmin Shu、Chuang Gan。 [abs]、2023.7
対話:協同組合としてのChatGptの可能性を探る
Po-lin Chen、Cheng-Shang Chang。 [abs]、2023.8
Autogen:Multi-Agent Conversation Frameworkを介して次世代LLMアプリケーションを有効にします
清wu、ガガン・バンサル、ジーユ・チャン、Yiran Wu、Shaokun Zhang、Erkang Zhu、Beibin Li、Li Jiang、Xiaoyun Zhang、Chi Wang。 [abs]、2023.8
プロンプトエンジニアリングを介して、大規模な言語モデルとエージェントベースのモデリングの交差点を探る
エドワード・ジュンプルング。 [abs]、2023.8
ネストされたマルチエージェント推論に対する神経償却推論
Kunal Jha、Tuan Anh Le、Chuanyang Jin、Yen-Ling Kuo、Joshua B. Tenenbaum、Tianmin Shu。 [abs]、2023.8
GPT-in-theLoop:マルチエージェントシステムの適応意思決定
ナタリア・ナシメント、パウロ・アレンカー、ドナルド・コーワン。 [abs]、2023.8
Proagent:大規模な言語モデルを備えたプロアクティブな協同AIの構築
Ceyao Zhang、Kaijie Yang、Siyi Hu、Zihao Wang、Guanghe Li、Yihang Sun、Cheng Zhang、Zhaowei Zhang、Anji Liu、Song-Chun Zhu、Xiaojun Chang、Junge Zhang、Feng Yin、Yitao Liang、Yaodong Yang。 [abs]、2023.8
MINDAGENT:新たなゲームの相互作用
Ran Gong、Qiuyuan Huang、Xiaojian MA、Hoi Vo、Zane Durante Yusuke Noda、Zilong Zheng、Song-Chun Zhu Demetri Terzopoulos、Li Fei-Fei、Jianfeng Gao。 [abs]、2023.9
LLMエージェントのコラボレーションメカニズムの探求:社会心理学の見解
Jintian Zhang、Xin Xu、shumin deng。 [abs]、2023.10
Lumos:統一されたデータ、モジュラー設計、およびオープンソースLLMを備えた学習エージェント
Da Yin、Faeze Brahman、Abhilasha Ravichander、Khyathi Chandu、Kai-Wei Chang、Yejin Choi、Bill Yuchen Lin。 [abs]、2023.11
AutoAct:自動プランニングを介してゼロから学習する自動エージェント
Shuofei Qiao、Ningyu Zhang、Runnan Fang、Yujie Luo、Wangchunshu Zhou、Yuchen Eleanor Jiang、Chengfei LV、Huajun Chen。 [AB]、2024.01
Corex:マルチモデルコラボレーションを通じて複雑な推論の境界を押し上げる
Qiushi Sun、Zhangyue Yin、Xiang Li、Zhiyong Wu、Xipeng Qiu、Lingpeng Kong。 [abs]、2023.10
COMM:複雑な問題解決を求める共同マルチエージェント、マルチリリーフパスパス
Pei Chen、Boran Han、Shuai Zhang。 [AB]、2024.4
未知の未知数へ:言語モデルエージェントの会話への参加を通じて人間の学習
Yucheng Jiang、Yijia Shao、Dekun MA、Sina J. Semnani、Monica S. Lam。 [AB]、2024.8
大文字の議論を通じて、大規模な言語モデルでの異なる思考を奨励する
Tian Liang、Zhiwei He、Wenxiang Jiao、Xing Wang、Yan Wang、Rui Wang、Yujiu Yang、Zhaopeng Tu、Shuming Shi。 [abs]、2023.5
マルチエージェントの議論を通じて言語モデルの事実と推論を改善する
Yilun du、Shuang Li、Antonio Torralba、Joshua B. Tenenbaum、Igor Mordatch。 [abs]、2023.5
AIフィードバックからの自己プレイとコンテキスト内学習との言語モデルの交渉の改善
Yao Fu、Hao Peng、Tushar Khot、Mirella Lapata。 [abs]、2023.5
ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate
Chi-Min Chan, Weize Chen, Yusheng Su, Jianxuan Yu, Wei Xue, Shanghang Zhang, Jie Fu, Zhiyuan Liu. [abs], 2023.8
How susceptible are LLMs to Logical Fallacies?
Amirreza Payandeh, Dan Pluth, Jordan Hosier, Xuesu Xiao, Vijay K. Gurbani. [abs], 2023.8
Identifying the Risks of LM Agents with an LM-Emulated Sandbox
Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy Ba, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto. [abs], 2023.9
Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View
Jintian Zhang, Xin Xu, Shumin Deng. [abs], 2023.10
Generative Agents: Interactive Simulacra of Human Behavior
Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein. [abs], 2023.4
Training Socially Aligned Language Models in Simulated Human Society.
Ruibo Liu, Ruixin Yang, Chenyan Jia, Ge Zhang, Denny Zhou, Andrew M. Dai, Diyi Yang, Soroush Vosoughi. [abs], 2023.5
The Role of Summarization in Generative Agents: A Preliminary Perspective
Xiachong Feng, Xiaocheng Feng, Bing Qin. [abs], 2023.5
Epidemic Modeling with Generative Agents.
Ross Williams, Niyousha Hosseinichimeh, Aritra Majumdar, Navid Ghaffarzadegan. [abs], 2023.7
S^3: Social-network Simulation System with Large Language Model-Empowered Agents
Chen Gao, Xiaochong Lan, Zhihong Lu, Jinzhu Mao, Jinghua Piao, Huandong Wang, Depeng Jin, Yong Li. [abs],2023.7
AgentSims: An Open-Source Sandbox for Large Language Model Evaluation
Jiaju Lin, Haoran Zhao, Aochi Zhang, Yiting Wu, Huqiuyue Ping, Qin Chen . [abs], 2023.8
CGMI: Configurable General Multi-Agent Interaction Framework
Shi Jinxin, Zhao Jiabao, Wang Yilei, Wu Xingjiao, Li Jiawen, He Liang. [abs], 2023.8
EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education
Yuhao Dan, Zhikai Lei, Yiyang Gu, Yong Li, Jianghao Yin, Jiaju Lin, Linhao Ye, Zhiyan Tie, Yougen Zhou, Yilei Wang, Aimin Zhou, Ze Zhou, Qin Chen, Jie Zhou, Liang He, Xipeng Qiu. [abs], 2023.8
SuperAgent: A Customer Service Chatbot for E-commerce Websites
Lei Cui, Shaohan Huang, Furu Wei, Chuanqi Tan, Chaoqun Duan, Ming Zhou. [paper], 2017
WebArena: A Realistic Web Environment for Building Autonomous Agents
Shuyan Zhou, Frank F. Xu, Hao Zhu, Xuhui Zhou, Robert Lo, Abishek Sridhar, Xianyi Cheng, Yonatan Bisk, Daniel Fried, Uri Alon, Graham Neubig. [abs], 2023.7
LLM As DBA
Xuanhe Zhou, Guoliang Li, Zhiyuan Liu. [abs], 2023.8
RoboAgent: Generalization and Efficiency in Robot Manipulation via Semantic Augmentations and Action Chunking
Homanga Bharadhwaj, Jay Vakil, Mohit Sharma, Abhinav Gupta, Shubham Tulsiani, Vikash Kumar. [paper], 2023
Is There Any Social Principle for LLM-Based Agents?
Jitao Bai, Simiao Zhang, Zhonghao Chen. [abs], 2023.8
ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving
Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Minlie Huang, Nan Duan, Weizhu Chen. [abs] [code], 2023.9
Agentic Skill Discovery
Xufeng Zhao, Cornelius Weber, Stefan Wermter [abs] [code], 2024.5
Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models
Yijia Shao, Yucheng Jiang, Theodore A. Kanell, Peter Xu, Omar Khattab, Monica S. Lam. [abs], [code], 2024.4
Agents: An Open-source Framework for Autonomous Language Agents
Wangchunshu Zhou, Yuchen Eleanor Jiang, Long Li, Jialong Wu, Tiannan Wang, Shi Qiu, Jintian Zhang, Jing Chen, Ruipu Wu, Shuai Wang, Shiding Zhu, Jiyu Chen, Wentao Zhang, Ningyu Zhang, Huajun Chen, Peng Cui, Mrinmaya Sachan. [abs], 2023.9
Dynamic LLM-Agent Network: An LLM-agent Collaboration Framework with Agent Team Optimization
Zijun Liu, Yanzhe Zhang, Peng Li, Yang Liu, Diyi Yang. [abs], 2023.10
OpenAgents: An Open Platform for Language Agents in the Wild
Tianbao Xie, Fan Zhou, Zhoujun Cheng, Peng Shi, Luoxuan Weng, Yitao Liu, Toh Jing Hua, Junning Zhao, Qian Liu, Che Liu, Leo Z. Liu, Yiheng Xu, Hongjin Su, Dongchan Shin, Caiming Xiong, Tao Yu. [abs], 2023.10
AutoAct: Automatic Agent Learning from Scratch via Self-Planning
Shuofei Qiao, Ningyu Zhang, Runnan Fang, Yujie Luo, Wangchunshu Zhou, Yuchen Eleanor Jiang, Chengfei Lv, Huajun Chen. [abs], 2024.01
An Interactive Agent Foundation Model
Zane Durante, Bidipta Sarkar, Ran Gong, Rohan Taori, Yusuke Noda, Paul Tang, Ehsan Adeli, Shrinidhi Kowshika Lakshmikanth, Kevin Schulman, Arnold Milstein, Demetri Terzopoulos, Ade Famoti, Noboru Kuno, Ashley Llorens, Hoi Vo, Katsu Ikeuchi, Li Fei-Fei, Jianfeng Gao, Naoki Wake, Qiuyuan Huang. [abs], 2024.02
Emergence of Social Norms in Generative Agent Societies: Principles and Architecture
Siyue Ren, Zhiyao Cui, Ruiqi Song, Zhen Wang, Shuyue Hu. [abs], 2024.03
Interactive Evolution: A Neural-Symbolic Self-Training Framework For Large Language Models
Fangzhi Xu, Qiushi Sun, Kanzhi Cheng, Jun Liu, Yu Qiao, Zhiyong Wu. [abs], 2024.06
AgentSquare: Automatic LLM Agent Search in Modular Design Space
Yu Shang, Yu Li, Keyu Zhao, Likai Ma, Jiahe Liu, Fengli Xu, Yong Li [abs], 2024.10
Enhancing Trust in LLM-Based AI Automation Agents: New Considerations and Future Challenges
Sivan Schwartz, Avi Yaeli, Segev Shlomov. [abs], 2023.8
Mind2Web: Towards a Generalist Agent for the Web
Xiang Deng, Yu Gu, Boyuan Zheng, Shijie Chen, Samuel Stevens, Boshi Wang, Huan Sun, Yu Su. [abs], 2023.6
The Tong Test: Evaluating Artificial General Intelligence Through Dynamic Embodied Physical and Social Interactions
Yujia Peng , Jiaheng Han, Zhenliang Zhang , Lifeng Fan , Tengyu Liu, Siyuan Qi, Xue Feng, Yuxi Ma, Yizhou Wang, Song-Chun Zhu. [abs], 2023.7
AgentBench: Evaluating LLMs as Agents
Xiao Liu, Hao Yu, Hanchen Zhang, Yifan Xu, Xuanyu Lei, Hanyu Lai, Yu Gu, Hangliang Ding, Kaiwen Men, Kejuan Yang, Shudan Zhang, Xiang Deng, Aohan Zeng, Zhengxiao Du, Chenhui Zhang, Sheng Shen, Tianjun Zhang, Yu Su, Huan Sun, Minlie Huang, Yuxiao Dong, Jie Tang . [abs], 2023.8
BOLAA: Benchmarking and Orchestrating LLM-augmented Autonomous Agents.
Zhiwei Liu, Weiran Yao, Jianguo Zhang, Le Xue, Shelby Heinecke, Rithesh Murthy, Yihao Feng, Zeyuan Chen, Juan Carlos Niebles, Devansh Arpit, Ran Xu, Phil Mui, Huan Wang, Caiming Xiong, Silvio Savarese. [abs], 2023.8
Identifying the Risks of LM Agents with an LM-Emulated Sandbox
Yangjun Ruan, Honghua Dong, Andrew Wang, Silviu Pitis, Yongchao Zhou, Jimmy Ba, Yann Dubois, Chris J. Maddison, Tatsunori Hashimoto. [abs], 2023.9
T-Eval: Evaluating the Tool Utilization Capability of Large Language Models Step by Step
Zehui Chen, Weihua Du, Wenwei Zhang, Kuikun Liu, Jiangning Liu, Miao Zheng, Jingming Zhuo, Songyang Zhang, Dahua Lin, Kai Chen, Feng Zhao. [abs], 2023.12
TravelPlanner: A Benchmark for Real-World Planning with Language Agents
Jian Xie, Kai Zhang, Jiangjie Chen, Tinghui Zhu, Renze Lou, Yuandong Tian, Yanghua Xiao, Yu Su. [abs], 2024.02
AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents
Chang Ma, Junlei Zhang, Zhihao Zhu, Cheng Yang, Yujiu Yang, Yaohui Jin, Zhenzhong Lan, Lingpeng Kong, Junxian He. [abs], 2024.01
OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments
Tianbao Xie, Danyang Zhang, Jixuan Chen, Xiaochuan Li, Siheng Zhao, Ruisheng Cao, Toh Jing Hua, Zhoujun Cheng, Dongchan Shin, Fangyu Lei, Yitao Liu, Yiheng Xu, Shuyan Zhou, Silvio Savarese, Caiming Xiong, Victor Zhong, Tao Yu. [abs], 2024.04
TimeChara: Evaluating Point-in-Time Character Hallucination of Role-Playing Large Language Models
Jaewoo Ahn, Taehyun Lee, Junyoung Lim, Jin-Hwa Kim, Sangdoo Yun, Hwaran Lee, Gunhee Kim. [abs], 2024.05
AppWorld: A Controllable World of Apps and People for Benchmarking Interactive Coding Agents
Harsh Trivedi, Tushar Khot, Mareike Hartmann, Ruskin Manku, Vinty Dong, Edward Li, Shashank Gupta, Ashish Sabharwal, Niranjan Balasubramanian. [abs], 2024.07
Benchmarking Agentic Workflow Generation
Shuofei Qiao, Runnan Fang, Zhisong Qiu, Xiaobin Wang, Ningyu Zhang, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen . [abs], 2024.10
| 種類 | ツール |
|---|---|
| Agent with tool | AutoGPT、LangChain、Transformer Agents、WorkGPT、AutoChain 、Langroid、 WebArena、GPT Researcher、BMTools、ToolBench 、AgentGPT、xlang |
| Multi-Agent | CAMEL、GPTeam、AgentVerse、MetaGPT、Langroid、SocraticAI、AutoGen、Agents |
| その他 | AutoAgents 、GPT Engineer |
Auto-GPT. An experimental open-source attempt to make GPT-4 fully autonomous.
LangChain. Building applications with LLMs through composability.
キャメル。 Communicative Agents for “Mind” Exploration of Large Scale Language Model Society.
GPTeam. GPTeam: An open-source multi-agent simulation.
Transformer Agents. In short, it provides a natural language API on top of transformers: we define a set of curated tools and design an agent to interpret natural language and to use these tools.
AgentVerse . A Framework for Multi-LLM Environment Simulation.
AutoAgents. Complex question answering in LLMs with enhanced reasoning and information-seeking capabilities.
GPT Engineer . Specify what you want it to build, the AI asks for clarification, and then builds it.
MetaGPT. The Multi-Agent Framework: Given one line Requirement, return PRD, Design, Tasks, Repo
WorkGPT. A GPT agent framework for invoking APIs.
AutoChain. Build lightweight, extensible, and testable LLM Agents.
Langroid. Harness LLMs with Multi-Agent Programming.
SocraticAI. Problem solving by engaging multiple AI agents in conversation with each other and the user.
WebArena. A Realistic Web Environment for Building Autonomous Agents.
GPT Researcher. GPT based autonomous agent that does online comprehensive research on any given topic.
BMTools. Tool Learning for Big Models, Open-Source Solutions of ChatGPT-Plugins
ToolBench. An open platform for training, serving, and evaluating large language model for tool learning.
AgentGPT. Assemble, configure, and deploy autonomous AI Agents in your browser.
xlang. An open-source framework for building and evaluating language model agents via executable language grounding
Agently. A fast way to build LLM Agent based Application ? A light weight framework helps developers to create amazing LLM based applications.
Lagent. A lightweight framework for building LLM-based agents.
ToolEmu An LLM-based emulation framework for testing and identifying the risks of LLM-based agents
storm A knowledge agent that researches a topic and generates a full-length report with citations.
" Join us in improving this repository! If you know of any important works we've missed, please contribute. Your efforts are highly valued! "