很棒的LLM驱动代理商
得益于大语模型(LLMS)的令人印象深刻的计划,推理和工具称呼功能,人们正在积极研究和开发LLM驱动的代理商。这些代理可以自主(和协作)解决复杂的任务,或模拟人类的互动。
该项目的目标是建立与LLM驱动的代理商有关的详尽资源集合,其中包括论文,存储库等。我们努力定期,连续地保持这些更新。我们非常感谢通过PR,问题,电子邮件或其他方法的任何贡献。
请注意,该存储库不受主动维护。它主要包含在2023年10月之前发表的论文,并提供了另外几篇论文。如果您想包含论文,请随时发起拉动请求。
- 文件
- 自主任务求解器
- 一般推理与计划和工具使用
- 多代理合作
- 框架和开源
- 应用
- 网络代理
- RL代理
- 机器人和体现的AI
- 游戏与角色扮演
- 其他应用程序
- 值得信赖
- 人类相互作用模拟
- 人类代理人的互动
- 代理驱动的LLM
- 基准
- 调查与教程
- 开源项目
- 观点
- 其他相关来源
- 致谢
文件
对于具有> 50个引用或存储库的论文,具有> 200星。
对于著名的会议/期刊接受的论文。
自主任务求解器
一般推理与计划和工具使用
- [2024年5月] “具有可学习权重的功能的语言模型代理的离线培训。” Shaokun Zhang(PSU)等。 ICML 2024。[纸] [代码]
- [2024年3月] “ Agent-Flan:为大型语言模型设计有效代理调整的数据和方法。” Zehui Chen(USTC)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年12月] “ Clova:具有工具使用和更新的闭环视觉助手。” Zhi Gao(Bigai)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年12月] “ Saycanpay:使用可学习领域知识的大型语言模型的启发式计划。” Rishi Hazra等。 AAAI 2024 [PAPER] [代码] [项目页面]
- [2023年10月] “语言代理树搜索统一了语言模型中的推理和计划。” Andy Zhou(uiuc)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年10月] “大型语言模型还无法自我纠正推理。” Jie Huang(UIUC)等。 ICLR 2024。[纸]
- [2023年10月] “通过沟通来调整LLM代理。” Kuan Wang(Gatech&Microsoft)等。 arxiv。 [纸]
- [2023年10月] “工具链*:使用*搜索的大语言模型中的有效动作空间导航” Yuchen Zhuang(Gatech&Adobe)等。 ICLR 2024。[纸]
- [2023年9月] “ AVIS:使用大型语言模型寻求自动视觉信息”。 Ziniu Hu(Google)等。神经2023。[纸]
- [2023年9月] “未来的理由,现在采取行动:具有可证明样品效率的自动LLM代理的原则框架。”刘(西北)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] “自驱动的基础:具有自动语言一致技巧学习的大语言模型代理。” Shaohui Peng(CAS)等。 arxiv。 [纸]
- [2023年8月] “开除:LLM代理是经验学习者。”安德鲁·赵(Thu)等人。 arxiv。 [纸]
- [2023年8月] “大语言模型和认知体系结构的协同整合:可靠的AI:探索性分析。” Oscar J. Romero(CMU)等。 arxiv。 [纸]
- [2023年8月] “ llm的动态计划”。 Gautier Dagan(爱丁堡U)等。 arxiv。 [纸] [代码]
- [2023年8月] “改造:具有政策梯度优化的回顾性大语言代理。” Weiran Yao(Salesforce)等。 arxiv。 [纸]
- [2023年5月] “ Rewoo:与有效的增强语言模型的观察相结合的推理。” Binfeng Xu等。 arxiv。 [纸] [代码]
- [2023年5月] “ Swiftsage:一种生成代理,对复杂的交互式任务具有快速和缓慢的思考。” Bill Yuchen Lin(AI2)等。神经2023。[纸] [代码] [项目页面]
- [2023年5月] “ Adaplanner:与语言模型的反馈自适应计划。” Haotian Sun(Gatech)等。神经2023。[纸] [代码]
- [2022年5月] “使用语言模型的推理正在与世界模型进行计划。” Shibo Hao(UCSD)等。 EMNLP 2023。[paper] [代码] [项目页面]
- [2023年5月] “利用预先培训的大型语言模型来构建和利用世界模型进行基于模型的任务计划。” Lin Guan(ASU)等。神经2023。[纸] [代码] [项目页面]
- [2023年5月] “ Chatcot:基于聊天的大语言模型的工具促进链的推理。” Zhipeng Chen(Ruc)等。 EMNLP 2023调查结果。 [纸] [代码]
- [2023年5月] “评论家:大型语言模型可以通过工具相互作用的批评自我纠正。” Zhibin Gou(Thu&Microsoft)等。 arxiv。 [纸] [代码]
- [2023年4月] “ LLM+P:以最佳的计划能力授权大型语言模型。” Bo Liu(UT Austin)等。 arxiv。 [纸] [代码]
- [2023年3月] “反射:具有口头加强学习的语言代理”。 Noah Shinn(Northeastern)等。神经2023。[纸] [代码]
- [2022年12月] “不要生成,歧视:将语言模型扎根于现实世界环境的建议” Yu Gu(OSU)等。 ACL 2023。[纸] [代码]
- [2022年10月] “反应:在语言模型中协同推理和作用。” Shunyu Yao(普林斯顿和Google Brain)等。 ICLR 2023。[纸] [代码] [项目页面]
多代理合作
- [2024年8月] “ Megaagent:大规模LLM代理系统中自主合作的实用框架” Qian Wang(Nus)等人* Arxiv。 [纸]
- [2024年5月] “合规,串意和模仿:多代理LLM协作中的角色不一致。” Razan Baltaji(UIUC)等人* Arxiv。 [纸] [代码]
- [2024年4月] “ COMM:协作多代理,多回答,促使复杂的问题解决。” Pei Chen(Tamu)等人* NAACL 2024。[纸] [代码]
- [2024年1月] “ L2MAC:大型语言模型自动计算机,以生成广泛的代码。”塞缪尔·霍尔特(剑桥)等。 ICLR 2024。[纸] [代码] [项目页面]
- [2023年10月] “评估大语言模型中的多代理协调能力”。 Saaket Agashe(UCSC)等。 arxiv。 [纸]
- [2023年10月] “动态LLM代理网络:具有代理团队优化的LLM代理协作框架。” Zijun Liu(Thu&Stanford)等。 arxiv。 [纸] [代码]
- [2023年10月] “探索LLM代理的协作机制:一种社会心理学观点。” Jintian Zhang(Zju)等。 arxiv。 [纸] [代码]
- [2023年10月] “ Corex:通过多模型协作来推动复杂推理的界限。” Qiushi Sun(上海AI Lab&Nus)等。 arxiv。 [纸] [代码]
- [2023年9月] “ LLM-局限性:通过交互式多代理游戏评估LLM。” Sahar Abdelnabi(Cispa)等。 arxiv。 [纸] [代码]
- [2023年9月] “可扩展的多机器人合作与大语言模型:集中式或分散的系统?”杨乔(MIT&Harvard)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] “和解:圆桌会议会议通过不同的LLMS之间的共识提高了推理。” Justin Chih-Yao Chen(UNC Chapel Hill)等。 arxiv。 [纸] [代码]
- [2023年9月] “ Mindagent:新兴的游戏互动”。小米(Bigai)等人。 arxiv。 [纸] [代码] [项目页面]
- [2023年8月] “主动:建立具有大语言模型的主动合作AI。” Ceyao Zhang(Cuhk&Pku)等。 arxiv。 [纸] [项目页面]
- [2023年8月] “代理:促进多代理协作并探索代理商中的新兴行为。” Weize Chen(Thu)等人。 arxiv。 [纸] [代码]
- [2023年8月] “循环中的GPT:对多基因系统的自适应决策”。 Nathalia Nascimento(Waterloo U)等。 arxiv。 [纸]
- [2023年8月] “ LLMS对逻辑谬论有多敏感?” Amirreza Payandeh(GMU&Vail Systems)等。 arxiv。 [纸] [代码]
- [2023年8月] “ Chateval:通过多代理辩论迈向更好的基于LLM的评估者。” Chi-Min Chan(Thu)等。 arxiv。 [纸] [代码]
- [2023年8月] “ LLM为DBA”。 Xuanhe Zhou(thu)等。 arxiv。 [纸] [代码]
- [2023年8月] “ gentopia:工具启动LLMS的协作平台。” Binfeng Xu等。 arxiv。 [纸] [代码] [项目页面]
- [2023年8月] “ METAGPT:用于多代理协作框架的元编程”。 Sirui Hong(Deepwisdom)等。 arxiv。 [纸] [代码]
- [2023年7月] “ PRD:同行排名和讨论改善了基于语言模型的大型评估。” Ruosen Li(ut Dallas)等。 arxiv。 [纸] [项目页] [代码]
- [2023年7月] “大语言模型中释放认知协同作用:通过多人自我合作来解决任务的代理。” Zhenhailong Wang(UIUC&MSRA)等。 arxiv。 [纸] [代码]
- [2023年7月] “ Roco:与大语言模型的辩证法多机器人合作。” Mandi Zhao(哥伦比亚)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年7月] “无线多代理生成AI:从连接的情报到集体智能。” Hang Zou(阿联酋技术创新研究所)等。 arxiv。 [纸]
- [7月2023年] “建立合作式体现的代理,以大型语言模型模块化。” Hongxin Zhang(UMass)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年6月] “ Restgpt:通过Restful API将大型语言模型与现实世界应用程序联系起来。” Yifan Song(PKU)等。 arxiv。 [纸] [项目页面]
- [2023年6月] “多代理协作:利用智能LLM代理商的力量。” Yashar Talebirad(Ualberta)等。 arxiv。 [纸]
- [2023年5月] “通过多代理辩论在大语言模型中鼓励不同的思维”。天梁(Thu&Tencent)等。 arxiv。 [纸] [代码]
- [2023年5月] “作为工具制造商的大型语言模型”。 Tianle Cai(Deepmind&Princeton)等。 arxiv。 [纸] [代码]
- [2023年5月] “通过多种辩论改善语言模型中的事实和推理”。 Yilun DU(MIT)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年5月] “贝叶斯感知模型中的一致性和统计效率”。 Yash Deshpande(MIT)等。 arxiv。 [纸]
- [2023年5月] “从AI反馈中改善语言模型谈判,并在自言自语中学习。” Yao Fu(爱丁堡U)等。 arxiv。 [纸] [代码]
框架和开源
- [2023年10月] “ OpenIgents:野外语言代理商的开放平台。” Tianbao Xie(HKU&Xlang Lab)等。 arxiv。 [纸] [代码]
- [2023年9月] “自动代理:自动代理生成的框架”。陈(PKU)等。 arxiv。 [纸] [代码]
- [2023年9月] “代理:自主语言代理的开源框架”。 Wangchunshu Zhou(AI Waves)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] “语言代理的认知体系结构”。西奥多·苏梅斯(Princeton)等。 arxiv。 [纸] [repo]
- [2023年8月] “ Autogen:通过多代理对话框架启用下一代LLM应用程序。”青云等。 arxiv。 [纸] [代码] [项目页面]
- [2023年8月] “快速机构:将多代理工作流程进行生产的最快方法。” Davor Runje等。 [代码] [项目页面]
应用
网络代理
- [2023年9月] “您仅查看屏幕:多模式链链代理。” Zhang Zhang(Sjtu)等。 arxiv。 [纸] [代码]
- [2023年9月] “激光:用于Web导航的州空间探索的LLM代理。” Kaixin MA(Tencent)等。 arxiv。 [纸] [代码]
- [2023年7月] “ Webarena:一个现实的网络环境,用于构建自主代理。” Shuyan Zhou(CMU)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年7月] “一个现实世界中的webagent,具有计划,长篇小说理解和程序综合。” Izzeddin Gur(DeepMind)等。 arxiv。 [纸]
- [2023年6月] “ Mind2web:迈向网络通才代理。” Xiang Deng(OSU)等。神经2023。[纸] [代码] [项目页面]
- [2023年5月] “通过大型语言模型增强自动代理”。 CédricColas(Mit&Inria)等。 arxiv。 [纸]
- [2023年5月] “移动ENV:LLM时代交互式代理的评估平台和基准。” Danyang Zhang(SJTU)等。 arxiv。 [纸] [代码]
- [2023年4月] “大语言模型的新兴自主科学研究能力”。 Daniil A. Boiko(CMU)等。 arxiv。 [纸]
- [2023年3月] “语言模型可以解决计算机任务。” Geunwoo Kim(UCI)等。 arxiv。 [纸] [代码] [项目页面]
- [2022年7月] “网络店:与基础语言代理的可扩展现实世界网络互动。” Shunyu Yao(Princeton)等。神经2022。[纸] [代码] [项目页面]
RL代理
- [2024年5月] “代理技能发现”。 Xufeng Zhao(UHH)等。 arxiv。 [纸] [代码] [项目页面]
- [2024年5月] “智能探索:站在巨型基础模型的肩膀上。”康(UBC)等。 arxiv。 [纸]
- [2023年11月] “ Lafite-rl:”通过大型语言模型的反馈加速对机器人操纵的加速增强” Kun Chu(UHH)等人Crl WS @ Corl 2023。
- [2023年10月] “主题:人工智能反馈的内在动机”。 Martin Klissarov(Mila&Meta&McGill)等。 arxiv。 [纸]
- [2023年9月] “ Rladapter:桥接大型语言模型以加强开放世界的学习。” Wanpeng Zhang(PKU)等。 arxiv。 [纸]
- [2023年8月] “ lagr-seq:语言引导的加强学习,并进行样本效率的查询。” Thommen George Karimpanal(Deakin University)等。 arxiv。 [纸] [代码]
- [2023年7月] “对话塑造:通过NPC互动赋予代理。” Wei Zhou(Gatech)等。 arxiv。 [纸]
- [2023年7月] “迈向具有基础模型的统一代理。” Norman Di Palo(ICL和DeepMind)等。转世rl @ iclr 2023。[纸]
- [2023年6月] “大型语言模型是半参数增强剂学习代理。” Danyang Zhang(SJTU)等。神经2023。[纸]
- [2023年5月] “多代理强化学习中的语义对齐任务分解。” Wenhao Li(Cuhk)等。 arxiv。 [纸]
机器人和体现的AI
- [2024年11月] “劳工代理人:用于编排双人机器人的大语言模型” , Kun Chu(UHH)等。人形生物2024。[paper] [网站],[代码]
- [2024年7月] “奥德赛:以开放世界的技能授权代理商。” Shunyu Liu(Zhejiang University)等。 arxiv。 [纸] [代码]
- [2023年11月] “狮子座:3D世界中体现的通才特工。”小米(Bigai)等人。 arxiv。 [纸] [代码] [项目页面]
- [2023年11月] “ JARVIS-1:带有内存的多模式模型的开放世界多任务代理。” Zihao Wang(PKU)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年10月] “通过多模式大语言模型进行端到端的体现决策:具有GPT4-Vision及以后的探索。” Liang Chen(PKU)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年10月] “ Lancar:在非结构化环境中利用语言来吸引上下文感知机器人。” Chak Lam Shek(UMD)等。 arxiv。 [纸] [项目页面]
- [2023年9月] “ llm-grounder:以大语言模型为代理的开放式摄氏3D视觉接地。” Jianing Yang(Umich)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] “ Smart-LLM:使用大语言模型的智能多代理机器人任务计划。” Shyam Sundar Kannan(Purdue)等。 arxiv。 [纸] [项目页面]
- [2023年9月] “插入安全芯片:对LLM驱动的机器人代理的执行限制。” Ziyi Yang等。 arxiv。 [纸] [代码和视频]
- [2023年9月] “ Saynav:将大型语言模型接地,用于在新环境中导航的动态计划。” Abhinav Rajvanshi(SRI International)等。 arxiv。 [纸]
- [2023年9月] “用大语言模型进行发展脚手架。” M. Batuhan Celik(Bogazici University)等。 arxiv。 [纸]
- [2023年7月] “聊天中三月:交互式提示远程体现的参考表达。” Yanyuan Qiao(阿德莱德大学)等。 arxiv。 [纸] [代码]
- [2023年8月] “ A^2NAV:通过利用基础模型的视觉和语言能力来实现动作感知的零击机器人导航。” Peihao Chen(Scut)等。 arxiv。 [纸]
- [2023年7月] “具有大语言模型的实现任务计划”。 Zhenyu Wu(Bupt)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年6月] “实现代理与LLM之间的智能互动:一种增强学习方法。” Bin Hu(Zhejiang Lab)等。 arxiv。 [纸] [代码]
- [2023年5月] “ Minecraft中的幽灵:通过具有基于文本的知识和记忆的大语言模型,开放世界环境的通常有能力的代理。” Xizhou Zhu(Thu&Sensetim)等。 arxiv。 [纸] [代码]
- [2023年5月] “ Voyager:具有大语言模型的开放式体现的代理。” Guanzhi Wang(Nvidia&Caltech)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年5月] “计划,消除和轨道 - 语言模型是体现代理商的好老师。” Yue Wu(CMU)等。 arxiv。 [纸]
- [2023年2月] “描述,解释,计划和选择:与大语言模型的互动计划可以实现开放世界的多任务代理。” Zihao Wang(PKU)等。神经2023。[纸] [代码]
- [2023年2月] “与用于体现推理的语言模型合作。” Ishita Dasgupta(DeepMind)等。 Larel @ Neurips 2022。[纸]
- [2023年1月] “一本能够体现的特工梦想着像素化的绵羊:使用语言指导的世界建模实现的决策。” Kolby Nottingham(UCI)等。 ICML 2023。[纸] [代码] [项目页面]
- [2022年12月] “ LLM-Planner:具有大型语言模型的体现代理的基础计划很少。” Chan Hee Song(OSU)等。 ICCV 2023。[纸] [项目页面]
游戏与角色扮演
- [2024年5月] “ Timechara:评估角色扮演的大语言模型的时间点角色幻觉。” Jaewoo Ahn(SNU)等人。 ACL 2024的发现。[纸] [代码] [项目页面]
- [2023年10月] “从文本到战术:评估LLMS在Avalon游戏中。” Jonathan Light(RPI)等。 arxiv。 [纸] [代码]
- [2023年10月] “ Ruffle&Riley:迈向自动吸引会话辅导系统。” Robin Schmucker(CMU)等。 arxiv。 [纸]
- [2023年10月] “阿瓦隆的思想游戏:通过递归沉思与欺骗的战斗。” Shenzhi Wang(Thu)等人。 arxiv。 [纸]
- [2023年9月] “ Mindagent:新兴的游戏互动”。小米(Bigai)等人。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] “可疑的代理:与心智理论GPT-4一起玩不完美的信息游戏。”贾西亚郭(东京U)等。 arxiv。 [纸] [代码]
- [2023年8月] “环境冒险:教会有关发展复杂故事的教学。” Zexin Chen(Gatech)等。 arxiv。 [纸]
- [2023年7月] “ tachikuma:通过大型语言模型与多个字符和新颖对象进行复杂的相互作用。” Yuanzhi Liang(UTS)等。 arxiv。 [纸]
- [2023年5月] “具有大语言模型的角色扮演”。 Murray Shanahan(DeepMind&Icl)等。 arxiv。 [纸]
- [2023年5月] “ Clembench:使用游戏玩法将聊天优化的语言模型评估为对话代理。” Kranti Chalamalasetti(Potsdam大学)等。 arxiv。 [纸] [代码]
- [2023年4月] “迈向自主系统:通过大型语言模型代理增强了灵活的模块化生产系统。” Yuchen Xia(斯图加特大学)等。 arxiv。 [纸] [代码]
- [2023年3月] “骆驼:大规模语言模型社会的“思维”探索的交流代理。” Guohao Li(Kaust)等。神经2023。[纸] [代码] [项目页面]
其他应用程序
- [2024年5月] “ AgentClinic:一种评估模拟临床环境中AI的多模式基准基准” Samuel Schmidgall(Jhu&Stanford)等。 arxiv。 [纸] [代码] [项目页面]
- [2024年4月] “临床试验:具有大型语言模型推理的临床试验多代理系统” Ling Yue(RPI)等。 arxiv。 [纸] [代码]
- [2024年1月] “ Ehragent:代码赋予了大型语言模型,以使电子健康记录上的几乎没有复杂的表格推理。” Wenqi Shi(Gatech)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年10月] “ Optimus:使用MIP求解器和大型语言模型进行优化建模。” Ali Ahmaditeshnizi(Stanford)等。 arxiv。 [纸] [代码]
- [2023年10月] “使用大语言模型与合作行为相关的人格特质的进化模型。” Reiji Suzuki(Nagoya University)等。 arxiv。 [纸]
- [2023年10月] “大型语言模型(LLM)作为多个专家代理的系统:解决抽象和推理语料库(ARC)挑战的方法。” John Chong Min Tan(Nus)等。 arxiv。 [纸]
- [2023年10月] “一种语言代理进行正式定理的方法”。 Amitayush Thakur(UT Austin)等。 arxiv。 [纸]
- [2023年10月] “对话卫生代理:个性化的LLM驱动代理框架”。 Mahyar Abbasian(UCI)等。 arxiv。 [纸]
- [2023年10月] “ Oceangpt:海洋科学任务的大型语言模型”。 Zhen Bi(Zju&Donghai Lab)等。 arxiv。 [纸] [项目页面]
- [2023年10月] “ Voice2Action:语言模型作为虚拟现实中有效实时互动的代理。” Yang Su(Cornell Tech)。 arxiv。 [纸]
- [2023年9月] “ Tora:一种用于数学问题解决的工具集成推理剂。” Zhibin Gou(Thu&Microsoft)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] ““教AI如何编码”:使用大型语言模型作为编程教育的可教师。” Hyoungwook Jin(Kaist)等。 arxiv。 [纸]
- [2023年9月] “ SurreAldriver:基于大语言模型的城市环境中设计生成驱动器仿真框架。” Ye Jin(Thu)等。 arxiv。 [纸]
- [2023年9月] “大型语言模型作为诊所的代理商”。 Nikita Mehandru(UC Berkeley)等。 arxiv。 [纸]
- [2023年9月] “用于情感语言模型游戏代理的基于评估的情感架构。” Maximilian羊角面包(Uoy)等。 arxiv。 [纸]
- [2023年9月] “通过基于LLM的自主剂释放图形学习的力量”。 Lanning Wei(Cas&4paradigm)等。 arxiv。 [纸]
- [2023年9月] “ TradingGPT:具有分层内存和不同字符的多代理系统,可增强财务交易绩效。” Yang Li(Sit)等。 arxiv。 [纸]
- [2023年9月] “ ModelsCope-Agent:使用开源大型语言模型构建可自定义的代理系统。” Chenliang Li(Alibaba)等。 arxiv。 [纸] [代码] [演示]
- [2023年8月] “推荐AI代理:整合大型语言模型以进行交互式建议。” Xu Huang(USTC)等。 arxiv。 [纸] [代码]
- [2023年8月] “循环:大型语言模型的推荐代理。” Yancheng Wang(ASU)等。 arxiv。 [纸]
- [2023年8月] “ LLM为交通信号控制的LLM驱动的SIM到运行转移。” Longchao da(ASU)等。 arxiv。 [纸]
- [2023年8月] “从笼子里出来:随机鹦鹉在网络安全环境中如何获胜。” Maria Rigaki(čvut)等。 arxiv。 [纸] [代码]
- [2023年8月] “基于LLM的代理商是否有社会原则?” Jitao Bai(TJU)等。 arxiv。 [纸]
- [2023年8月] “ Chateda:EDA的大型语言模型为自主代理。” Zhuolun He(Cuhk&Shanghai AI实验室)等。 arxiv。 [纸]
- [2023年8月] “搭便车的计划分析指南:具有大语言模型的旅程。” Haonan Li(UCR)等。 arxiv。 [纸]
- [2023年6月] “通过对话大语言模型迈向自主测试剂。”罗伯特·费尔德(Chalmers Technology)等。 arxiv。 [纸]
- [2023年4月] “ Genegpt:使用域工具来增强大型语言模型,以改善获得生物医学信息的访问。” Qiao Jin,Yifan Yang,Qingyu Chen,Zhiyong Lu Arxiv。 [纸] [代码]
- [2023年3月] “ Hugginggpt:与Chatgpt及其朋友在拥抱脸上解决AI任务。” Yongliang Shen(Zju&Msra)等。 arxiv。 [纸] [代码]
值得信赖
- [2024年2月] “大型语言模型代理可以模拟人类的信任行为吗?” Chengxing Xie(Kaust)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年9月] “用LM含有LM的沙盒确定LM代理的风险” Yangjun Ruan(多伦多大学和载体研究所)等。 arxiv。 [纸] [代码] [demo] [项目页面]
- [2023年8月] “增强对基于LLM的AI自动化代理的信任:新的考虑和未来挑战。” Sivan Schwartz(IBM Research)等。 Automate @ ijcai 2023。[纸]
人类相互作用模拟
- [2024年3月] “基于大语言模型的代理社会中社会规范的出现”。 Siyue Ren(NWPU)等。 arxiv。 [纸] [代码]
- [2024年1月] “开放模型,封闭的思想?关于通过开放的大型语言模型模仿人格的代理人能力。” Lucio La Cava(卡拉布里亚大学)等。 arxiv。 [纸]
- [2023年10月] “ Sotopia:语言代理中社会智能的互动评估” *Xuhui Zhou(cmu)等人。
- [2023年10月] “竞争:了解基于大语言模型的代理商的竞争行为。” Qinlin Zhao(USTC)等。 arxiv。 [纸]
- [2023年10月] “使用大型语言模型模拟社交媒体来评估替代新闻源算法。” PetterTörnberg(阿姆斯特丹U)等。 arxiv。 [纸]
- [2023年10月] “将您的钱放在嘴里:评估拍卖领域LLM代理商的战略计划和执行。” Jiangjie Chen(FDU&AI2)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年10月] “ Lyfe代理:低成本实时社交互动的生成代理。” Zhao Kaiya(MIT)等。 arxiv。 [纸]
- [2023年9月] “用LM含有LM的沙盒确定LM代理的风险” Yangjun Ruan(多伦多大学和载体研究所)等。 arxiv。 [纸] [代码] [demo] [项目页面]
- [2023年9月] “基于生成代理的建模:通过将机械模型与生成人工智能耦合的社会系统动态。” Navid Ghaffarzadegan(Virginia Tech)等。 arxiv。 [纸]
- [2023年8月] “ CGMI:可配置的一般多代理交互框架。” Jinxin Shi(ECNU)等。 arxiv。 [纸]
- [2023年8月] “通过及时工程探索大语言模型和基于代理的建模的交集。”爱德华·詹普朗(UC Berkeley)等。 arxiv。 [纸] [代码]
- [2023年8月] “代理:大型语言模型评估的开源沙箱。” Jiju Lin(PTA Studio&PSU)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年7月] “ S^3:具有大型语言模型授权代理的社会网络模拟系统。” Chen Gao(Thu)等。 arxiv。 [纸]
- [2023年7月] “您是在化妆舞会吗?探索在线社交网络中大型语言模型驱动的社交机器人的行为和影响。” Siyu Li(Scu)等。 arxiv。 [纸] [数据集]
- [2023年7月] “用于软件开发的交流代理”。 Chen Qian(Thu)等人。 arxiv。 [纸]
- [7月2023年] “具有生成剂的流行模型”。罗斯·威廉姆斯(弗吉尼亚理工大学)等。 arxiv。 [纸] [代码]
- [2023年7月] “到无限及以后:多代理模拟中的Show-1和Showrunner代理。” Philipp Maas(寓言工作室)等。预印本。 [纸] [项目页面]
- [2023年6月] “递归:推荐系统的新型模拟范式。” Lei Wang(Ruc)等。 arxiv。 [纸] [代码]
- [2023年5月] “玩大型语言模型的重复游戏。” Elif Akata(Tübingen的U)等。 arxiv。 [纸]
- [2023年5月] “摘要在生成代理中的作用:初步观点。”小芳(Hit)等。 arxiv。 [纸]
- [2023年4月] “多方聊天:与人类和模型的小组设置中的对话代理。” Jimmy Wei(Cornell&Meta)等。 arxiv。 [PAPER] [DATASET] [代码]
- [2023年4月] “生成剂:人类行为的互动模拟”。 Joon Sung Park(Stanford)等。 arxiv。 [纸] [代码]
人类代理人的互动
- [2023年10月] “ AI处理如何延迟促进创造力:探索研究问题与基于LLM的代理共同创建。” Yiren Liu(UIUC)等。 arxiv。 [纸]
- [2023年8月] “量化大语模型对集体意见动态的影响。” Chao Li(Zju)等。 arxiv。 [纸]
- [2023年8月] “ Sapien:由大型语言模型提供动力的情感虚拟代理。” Masum Hasan(Rochester的U)等。 arxiv。 [纸]
- [2023年7月] “了解使用基于大型语言模型的对话代理进行心理福祉支持的好处和挑战。” Zilin MA(哈佛)等。 arxiv。 [纸]
代理驱动的LLM
- [2023年10月] “代理商指示大型语言模型是一般零击的推理者。” Nicholas Crispino(Washu)等。 arxiv。 [纸] [代码]
- [2023年10月] “ß-coder:基于价值的计划合成的深度强化学习”。 Zishun Yu(UIC&Bytedance)等。 arxiv。 [纸]
- [2023年5月] “在模拟人类社会中培训社会调整的语言模型”。 Ruibo Liu(Dartmouth)等。 arxiv。 [纸] [代码]
- [2023年5月] “语言模型符合世界模型:体现的体验增强了语言模型。” Jiannan Xiang(UCSD)等。神经2023。[纸] [代码]
基准
- [2024年7月] “ AppWorld:一个可控的应用程序和用于基准交互式编码代理的人的可控世界。”苛刻的Trivedi(Stony Brook University)等。 ACL 2024。[纸] [代码] [项目页面]
- [2023年12月] “ T-eval:逐步评估大语言模型的工具利用能力。” Zehui Chen(USTC,上海AI实验室)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年11月] “魔术:对认知,适应性,合理性和协作的大型语言模型的调查。” * Lin Xu等人(NUS,BYTEDANCE,Stanford&Stanford&UC Berkeley) * Arxiv。 [纸] [项目页面]
- [2023年10月] “平衡自主权和一致性:自动LLM驱动多代理体系结构的多维分类器。” ThorstenHändler(Fernfh)等。 arxiv。 [纸]
- [2023年10月] “将大语言模型作为AI研究代理商进行基准测试”。 Qian Huang(Stanford)等。 arxiv。 [纸] [代码]
- [2023年10月] “大语言模型的Metatool基准:决定是否使用工具和使用哪种工具。” Yue Huang(Lehigh University)等。 arxiv。 [纸] [数据集]
- [2023年10月] “ SmartPlay:LLMS作为智能代理商的基准。” Yue Wu(CMU&Microsoft)等。 arxiv。 [纸] [代码]
- [2023年9月] “用LM含有LM的沙盒确定LM代理的风险” Yangjun Ruan(多伦多大学和载体研究所)等。 arxiv。 [纸] [代码] [demo] [项目页面]
- [2023年8月] “ Bolaa:基准测试和精心策划LLM的自主代理商。” liu(Salesforce)等。 arxiv。 [纸] [代码]
- [2023年8月] “ AgentBench:评估LLM作为代理人”。小刘(Thu)等。 arxiv。 [纸] [代码] [项目页面]
- [2023年8月] “ TPTU:大型基于语言模型的AI代理的任务计划和工具使用情况。” Jingqing Ruan(Sensetime)等。 arxiv。 [纸]
- [2023年6月] “ ToolQA:使用外部工具回答的LLM问题的数据集。” Yuchen Zhuang(Gatech)等。神经2023。[纸] [代码]
调查与教程
- [2023年9月] “基于自然语言的上下文建模和LLMS推理:教程”。 Haoyi Xiong(Baidu)等。 arxiv。 [纸]
- [2023年9月] “对基于语言模型的大型人工智能代理的深入调查”。 Pengyu Zhao(BJTU)等。 arxiv。 [纸]
- [2023年9月] “基于大语言模型的代理人的兴起和潜力:调查。” Zhiheng XI(FDU)等。 arxiv。 [纸] [github]
- [2023年8月] “基于大语言模型的自主代理的调查”。 Lei Wang(Ruc)等。 arxiv。 [纸] [github]
- [2023年3月] “大语言模型的调查(第6.3节 - 计划复杂的任务解决)。”韦恩Xin Zhao(Ruc)等。 arxiv。 [纸] [github]
开源项目
自主任务求解器项目
- Auto-GPT-实验开源尝试使GPT-4完全自主。
- ?️? Langchain-通过合成性通过LLM构建应用程序。
- GPT工程师 - 指定您要建造的内容,AI要求澄清,然后构建它。
- metagpt-?多代理框架:给定一行要求,返回PRD,设计,任务,存储库。
- Babyagi- AI驱动的任务管理系统。
- L2MAC- LLM自动计算机框架:L2MAC
- Yacana- ??通过多代理聊天和筹集工作流程为OpenSource LLM提供动力。
多代理模拟项目
- AI镇?? - 可部署的入门套件,用于构建和自定义您自己的AI镇版本 - 一个虚拟城镇,AI角色居住,聊天和社交。
- GPTEAM-开源多代理模拟。
- ? Chatarena- LLM的多代理语言游戏环境。
- ?代理人? - 一个灵活的框架,简化了为大型语言模型(LLMS)构建自定义多代理环境的过程。
观点
- 语言代理:人工智能的关键进化步骤-YU SU(OSU),9月5日,2023年。
- 介绍Xlang:通过可执行语言接地构建语言模型代理的开源框架-Xlang Lab,2023年8月9日。
- 什么是GPT代理商?深入了解未来的AI界面 - 了解为什么代理是AI,Logan Kilpatrick(Openai)的未来的核心部分,2023年7月25日。
- 数字世界中的语言代理:机遇和风险 - Shunyu Yao(Princeton)等人,2023年7月24日。
- Kokomind:LLM可以理解社交互动吗? - 想象一个人工智能?在鸡尾酒会上?
- LLM动力自主代理商 - 莉莲·旺(Openai)(Openai)的惊人博客,2023年6月23日。
其他相关来源
- 个性化生成ai @ cikm'23
- LLM-Agent-Papers-回购列出了有关LLM角色扮演,内存机制和LLM游戏游戏的论文。
- LLMAGENTPAPER-关于LLMS多游戏的必读论文。
- Awesome-LLM代理 - 精选的LLM代理商列表。
致谢
我们非常感谢通过PR,问题,电子邮件或其他方法的任何贡献。 Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions. ❤️
The repository is initially built and maintained by Yupeng Hou ([email protected]).