煤炭:很棒的語言代理商

使用語言代理(?coala)框架的認知體系結構進行語言媒介的彙編。
- COALA PAPER(主要內容的16頁):https://arxiv.org/abs/2309.02427
- COATA Tweet(6個線程):https://twitter.com/shunyuyao12/status/16999396834983362690
- coala bibtex文件,帶有300多個相關引用:coala.bib
- coala bibtex引用如果您發現我們的工作/資源有用:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}煤炭概述
Coala整齊地指定了一個從其動作空間開始的語言代理,該空間有2個部分:
- 與外部環境互動的外部動作(接地)
- 內部行動與內部記憶(推理,檢索,學習)互動
- 語言代理具有短期工作記憶和幾個(可選的)長期記憶(經驗的情節,知識的語義,代碼/LLM的程序)
- 推理=更新工作記憶(使用LLM)
- 檢索=閱讀長期記憶
- 學習=寫長期記憶

那麼語言代理如何選擇要採取的動作呢?它的行動是在決策週期中結構的,每個週期都有兩個階段:
- 計劃:代理將推理/檢索措施應用於(迭代)提出和評估行動,然後選擇學習/接地行動。
- 執行:執行選定的學習/接地操作以影響內部記憶或外部世界。

要了解更多信息,請閱讀我們論文第4節。
文件
以下只是從Coala.bib Plus拉的請求中刮下來的一部分論文,並帶有可能不正確的動作空間標籤。日期基於ARXIV V1。它們並不代表所有語言代理工作,我們計劃盡快添加更多工作(歡迎拉請請求),並擁有用於高度引用的工作的標籤。
- (2021-10)AI鏈:通過鏈接大語言模型提示(推理),透明和可控制的人類互動
- (2021-10)SILG:多種環境符號互動語言基礎基準(環境)
- (2022-01)語言模型作為零擊計劃者:為具體代理提取可行的知識(接地)
- (2022-03)及時鏈接器:鏈接大語言模型通過視覺編程(接地)提示
- (2022-03)科學世界:您的經紀人比五年級學生聰明嗎? (環境)
- (2022-04)盡我所能,而不是我所說:機器人負擔中的基礎語言(接地)
- (2022-04)蘇格拉底式模型:用語言(接地)組成零拍的多模式推理
- (2022-07)網絡店:與基礎語言代理(環境)的可擴展現實世界網絡互動
- (2022-09)PROGPROMPT:使用大語言模型(接地)生成位置機器人任務計劃
- (2022-10)分解提示:解決複雜任務的模塊化方法(推理)
- (2022-10)Mind's Eye:通過模擬(接地)進行基礎語言模型推理
- (2022-10)反應:在語言模型(接地,推理)中協同推理和作用
- (2022-11)大型語言模型是人級及時工程師(推理)
- (2022-12)LLM-planner:具有大型語言模型(接地)的體現代理的基礎計劃很少
- (2022-12)不要產生,歧視:將語言模型接地到現實世界環境(接地)的建議
- (2023-02)事後見解鏈與反饋(學習)使語言模型保持一致
- (2023-02)描述,解釋,計劃和選擇:與大語言模型的互動計劃可實現開放世界的多任務代理(接地,推理)
- (2023-02)工具形式:語言模型可以教會自己使用工具(接地)
- (2023-03)決策的基礎模型:問題,方法和機會(調查)
- (2023-03)Hugginggpt:與Chatgpt及其朋友在擁抱面孔(接地)中解決AI任務
- (2023-03)PALM-E:一種具體的多模式模型(接地)
- (2023-03)反射:具有口頭增強學習的語言代理(接地,推理,學習)
- (2023-03)自我refine:迭代改進,帶有自我反饋(推理)
- (2023-03)使用大語言模型(推理)的自編制代碼生成
- (2023-04)生成劑:人類行為的交互式模擬(接地,推理,檢索,學習)
- (2023-04)大語言模型的新興自主科學研究能力(接地,推理)
- (2023-04)LLM+P:以最佳計劃能力(接地,推理)授權大型語言模型
- (2023-04)煉油廠:中間表示的推理反饋(推理)
- (2023-04)教導大型語言模型(推理)
- (2023-04)Genegpt:使用域工具增強大型語言模型,以改善獲得生物醫學信息(接地,推理)
- (2023-05)評論家:大語言模型可以與工具相互作用的批評(接地,推理,檢索)進行自我糾正
- (2023-05)通過大型語言模型(接地,推理,檢索,學習)增強自動代理
- (2023-05)Chatcot:基於聊天的大語言模型(接地,推理)的工具啟動的思想推理
- (2023-05)Toolkengpt:通過工具嵌入(接地,推理)使用大量工具來增強冷凍語言模型
- (2023-05)分解通過自我評估引導解碼(推理)增強推理
- (2023-05)通過多代理辯論(基礎,推理)鼓勵大語言模型中的不同思維
- (2023-05)通過多種辯論(基礎,推理)改善語言模型中的事實和推理
- (2023-05)Adaplanner:反饋與語言模型的自適應計劃(接地,檢索,學習)
- (2023-05)計劃和解決提示:通過大型語言模型(推理)改善零投入的推理推理
- (2023-05)rewoo:與高效增強語言模型(接地,推理)的觀察結果分離推理
- (2023-05)Swiftsage:一種生成劑,對複雜的交互任務(接地,推理)的快速和緩慢思考
- (2023-05)思想樹:大型語言模型(推理)故意解決問題
- (2023-05)Voyager:具有大語言模型(接地,推理,檢索,學習)的開放式體現的代理
- (2023-06)交換:用執行反饋(接地,推理)進行標準化和基准進行交互式編碼
- (2023-06)ToolQA:使用外部工具回答的LLM問題數據集(接地)
- (2023-06)Mind2Web:邁向網絡通才代理(環境)
- (2023-06)RESTGPT:將大型語言模型與現實世界中的RESTFUL API(接地,推理)聯繫起來
- (2023-06)Toolalpaca:具有3000個模擬案例(接地,推理)的語言模型的通用工具學習
- (2023-07)一個現實世界中的webagent,具有計劃,長篇小說理解和程序綜合(接地,推理)
- (2023-07)RT-2:視覺語言行動模型將Web知識轉移到機器人控制(接地)
- (2023-07)Roco:與大語言模型(接地)的辯證法多機器人合作
- (2023-07)尋求幫助的機器人:大語言模型計劃者的不確定性對齊(接地)
- (2023-07)S $^3 $:具有大語言模型授權代理(接地,推理)的社交網絡模擬系統
- (2023-07)TOOLLLM:促進大型語言模型掌握16000多個現實世界中的API(接地,推理,檢索)
- (2023-07)了解使用基於語言模型的大型對話代理進行心理健康支持(接地)的好處和挑戰
- (2023-07)在大語言模型中釋放認知協同作用:通過多人自我合作(接地,推理)來解決任務的代理
- (2023-07)Webarena:一個現實的網絡環境(環境)
- (2023-08)代理商:評估LLM作為代理(環境)
- (2023-08)代理:促進多代理協作並探索代理商(環境)中的新興行為
- (2023-08)Autogen:通過多代理對話框架(接地,推理)啟用下一代LLM應用程序
- (2023-08)CGMI:可配置的一般多代理互動框架(接地,推理)
- (2023-08)Chateval:通過多代理辯論(接地,推理)邁向更好的LLM評估者
- (2023-08)具有大語言模型(推理)的累積推理
- (2023-08)開除:LLM代理是體驗式學習者(接地,推理,檢索,學習)
- (2023-08)GPT-in-the-lin-in-the-lin-in-the-lin-the-limpy決策(接地,推理)
- (2023-08)Gentopia:工具增強LLMS(環境)的協作平台
- (2023-08)METAGPT:用於多代理協作框架的元編程(接地,推理)
- (2023-08)主張:具有大語言模型(接地,推理)的積極主動合作AI
- (2023-08)改造器:具有政策梯度優化(接地,推理,學習)的回顧性大語言代理
- (2023-08)Sapien:由大語言模型提供動力(接地,推理)的情感虛擬代理
- (2023-08)大語言模型和魯棒性AI認知體系結構的協同整合:探索性分析(接地,推理,檢索,學習)
- (2023-09)Tora:一種用於解決數學問題的工具集成推理劑(接地,推理,學習)
- (2023-09)識別具有LM含量沙箱(環境)的LM代理的風險
- (2023-09)懷疑劑:與心智理論的播放不完美的信息遊戲GPT-4(接地,推理)
- (2024-01)自我對比:通過不一致的解決觀點(推理,反思)更好地思考
- (2024-02)代理-Pro:通過政策級別的反思和優化學習發展(推理,反思,學習)
- (2024-03)LLM3:具有運動故障推理的基於語言模型的大型任務和運動計劃。 (計劃,推理)
- (2024-04)用AI代理(AI科學家,生物醫學研究)賦予生物醫學發現能力
- (2024-05)Timechara:評估角色扮演大語言模型(推理,檢索)的時間點角色幻覺
(更快添加更多。
資源
- LLM動力自主代理(Lil'log)
- LLM-Agent Papers
- llmagentpapers
- 很棒的llm驅動器
(更快添加更多。