煤炭:很棒的语言代理商

使用语言代理(?coala)框架的认知体系结构进行语言媒介的汇编。
- COALA PAPER(主要内容的16页):https://arxiv.org/abs/2309.02427
- COATA Tweet(6个线程):https://twitter.com/shunyuyao12/status/16999396834983362690
- coala bibtex文件,带有300多个相关引用:coala.bib
- coala bibtex引用如果您发现我们的工作/资源有用:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}煤炭概述
Coala整齐地指定了一个从其动作空间开始的语言代理,该空间有2个部分:
- 与外部环境互动的外部动作(接地)
- 内部行动与内部记忆(推理,检索,学习)互动
- 语言代理具有短期工作记忆和几个(可选的)长期记忆(经验的情节,知识的语义,代码/LLM的程序)
- 推理=更新工作记忆(使用LLM)
- 检索=阅读长期记忆
- 学习=写长期记忆

那么语言代理如何选择要采取的动作呢?它的行动是在决策周期中结构的,每个周期都有两个阶段:
- 计划:代理将推理/检索措施应用于(迭代)提出和评估行动,然后选择学习/接地行动。
- 执行:执行选定的学习/接地操作以影响内部记忆或外部世界。

要了解更多信息,请阅读我们论文第4节。
文件
以下只是从Coala.bib Plus拉的请求中刮下来的一部分论文,并带有可能不正确的动作空间标签。日期基于ARXIV V1。它们并不代表所有语言代理工作,我们计划尽快添加更多工作(欢迎拉请请求),并拥有用于高度引用的工作的标签。
- (2021-10)AI链:通过链接大语言模型提示(推理),透明和可控制的人类互动
- (2021-10)SILG:多种环境符号互动语言基础基准(环境)
- (2022-01)语言模型作为零击计划者:为具体代理提取可行的知识(接地)
- (2022-03)及时链接器:链接大语言模型通过视觉编程(接地)提示
- (2022-03)科学世界:您的经纪人比五年级学生聪明吗? (环境)
- (2022-04)尽我所能,而不是我所说:机器人负担中的基础语言(接地)
- (2022-04)苏格拉底式模型:用语言(接地)组成零拍的多模式推理
- (2022-07)网络店:与基础语言代理(环境)的可扩展现实世界网络互动
- (2022-09)PROGPROMPT:使用大语言模型(接地)生成位置机器人任务计划
- (2022-10)分解提示:解决复杂任务的模块化方法(推理)
- (2022-10)Mind's Eye:通过模拟(接地)进行基础语言模型推理
- (2022-10)反应:在语言模型(接地,推理)中协同推理和作用
- (2022-11)大型语言模型是人级及时工程师(推理)
- (2022-12)LLM-planner:具有大型语言模型(接地)的体现代理的基础计划很少
- (2022-12)不要产生,歧视:将语言模型接地到现实世界环境(接地)的建议
- (2023-02)事后见解链与反馈(学习)使语言模型保持一致
- (2023-02)描述,解释,计划和选择:与大语言模型的互动计划可实现开放世界的多任务代理(接地,推理)
- (2023-02)工具形式:语言模型可以教会自己使用工具(接地)
- (2023-03)决策的基础模型:问题,方法和机会(调查)
- (2023-03)Hugginggpt:与Chatgpt及其朋友在拥抱面孔(接地)中解决AI任务
- (2023-03)PALM-E:一种具体的多模式模型(接地)
- (2023-03)反射:具有口头增强学习的语言代理(接地,推理,学习)
- (2023-03)自我refine:迭代改进,带有自我反馈(推理)
- (2023-03)使用大语言模型(推理)的自编制代码生成
- (2023-04)生成剂:人类行为的交互式模拟(接地,推理,检索,学习)
- (2023-04)大语言模型的新兴自主科学研究能力(接地,推理)
- (2023-04)LLM+P:以最佳计划能力(接地,推理)授权大型语言模型
- (2023-04)炼油厂:中间表示的推理反馈(推理)
- (2023-04)教导大型语言模型(推理)
- (2023-04)Genegpt:使用域工具增强大型语言模型,以改善获得生物医学信息(接地,推理)
- (2023-05)评论家:大语言模型可以与工具相互作用的批评(接地,推理,检索)进行自我纠正
- (2023-05)通过大型语言模型(接地,推理,检索,学习)增强自动代理
- (2023-05)Chatcot:基于聊天的大语言模型(接地,推理)的工具启动的思想推理
- (2023-05)Toolkengpt:通过工具嵌入(接地,推理)使用大量工具来增强冷冻语言模型
- (2023-05)分解通过自我评估引导解码(推理)增强推理
- (2023-05)通过多代理辩论(基础,推理)鼓励大语言模型中的不同思维
- (2023-05)通过多种辩论(基础,推理)改善语言模型中的事实和推理
- (2023-05)Adaplanner:反馈与语言模型的自适应计划(接地,检索,学习)
- (2023-05)计划和解决提示:通过大型语言模型(推理)改善零投入的推理推理
- (2023-05)rewoo:与高效增强语言模型(接地,推理)的观察结果分离推理
- (2023-05)Swiftsage:一种生成剂,对复杂的交互任务(接地,推理)的快速和缓慢思考
- (2023-05)思想树:大型语言模型(推理)故意解决问题
- (2023-05)Voyager:具有大语言模型(接地,推理,检索,学习)的开放式体现的代理
- (2023-06)交换:用执行反馈(接地,推理)进行标准化和基准进行交互式编码
- (2023-06)ToolQA:使用外部工具回答的LLM问题数据集(接地)
- (2023-06)Mind2Web:迈向网络通才代理(环境)
- (2023-06)RESTGPT:将大型语言模型与现实世界中的RESTFUL API(接地,推理)联系起来
- (2023-06)Toolalpaca:具有3000个模拟案例(接地,推理)的语言模型的通用工具学习
- (2023-07)一个现实世界中的webagent,具有计划,长篇小说理解和程序综合(接地,推理)
- (2023-07)RT-2:视觉语言行动模型将Web知识转移到机器人控制(接地)
- (2023-07)Roco:与大语言模型(接地)的辩证法多机器人合作
- (2023-07)寻求帮助的机器人:大语言模型计划者的不确定性对齐(接地)
- (2023-07)S $^3 $:具有大语言模型授权代理(接地,推理)的社交网络模拟系统
- (2023-07)TOOLLLM:促进大型语言模型掌握16000多个现实世界中的API(接地,推理,检索)
- (2023-07)了解使用基于语言模型的大型对话代理进行心理健康支持(接地)的好处和挑战
- (2023-07)在大语言模型中释放认知协同作用:通过多人自我合作(接地,推理)来解决任务的代理
- (2023-07)Webarena:一个现实的网络环境(环境)
- (2023-08)代理商:评估LLM作为代理(环境)
- (2023-08)代理:促进多代理协作并探索代理商(环境)中的新兴行为
- (2023-08)Autogen:通过多代理对话框架(接地,推理)启用下一代LLM应用程序
- (2023-08)CGMI:可配置的一般多代理互动框架(接地,推理)
- (2023-08)Chateval:通过多代理辩论(接地,推理)迈向更好的LLM评估者
- (2023-08)具有大语言模型(推理)的累积推理
- (2023-08)开除:LLM代理是体验式学习者(接地,推理,检索,学习)
- (2023-08)GPT-in-the-lin-in-the-lin-in-the-lin-the-limpy决策(接地,推理)
- (2023-08)Gentopia:工具增强LLMS(环境)的协作平台
- (2023-08)METAGPT:用于多代理协作框架的元编程(接地,推理)
- (2023-08)主张:具有大语言模型(接地,推理)的积极主动合作AI
- (2023-08)改造器:具有政策梯度优化(接地,推理,学习)的回顾性大语言代理
- (2023-08)Sapien:由大语言模型提供动力(接地,推理)的情感虚拟代理
- (2023-08)大语言模型和鲁棒性AI认知体系结构的协同整合:探索性分析(接地,推理,检索,学习)
- (2023-09)Tora:一种用于解决数学问题的工具集成推理剂(接地,推理,学习)
- (2023-09)识别具有LM含量沙箱(环境)的LM代理的风险
- (2023-09)怀疑剂:与心智理论的播放不完美的信息游戏GPT-4(接地,推理)
- (2024-01)自我对比:通过不一致的解决观点(推理,反思)更好地思考
- (2024-02)代理-Pro:通过政策级别的反思和优化学习发展(推理,反思,学习)
- (2024-03)LLM3:具有运动故障推理的基于语言模型的大型任务和运动计划。 (计划,推理)
- (2024-04)用AI代理(AI科学家,生物医学研究)赋予生物医学发现能力
- (2024-05)Timechara:评估角色扮演大语言模型(推理,检索)的时间点角色幻觉
(更快添加更多。
资源
- LLM动力自主代理(Lil'log)
- LLM-Agent Papers
- llmagentpapers
- 很棒的llm驱动器
(更快添加更多。