? Coala: ตัวแทนภาษาที่ยอดเยี่ยม

การรวบรวมตัวแทนภาษาโดยใช้ สถาปัตยกรรมความรู้ความเข้าใจสำหรับกรอบภาษา (? Coala)
- กระดาษถ่านหิน (16 หน้าของเนื้อหาหลัก): https://arxiv.org/abs/2309.02427
- Coala Tweet (6 เธรด): https://twitter.com/shunyuyao12/status/1699396834983362690
- ไฟล์ Coala Bibtex ที่มีการอ้างอิงที่เกี่ยวข้อง 300+: Coala.bib
- การอ้างอิง Coala Bibtex หากคุณพบว่างาน/ทรัพยากรของเรามีประโยชน์:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}ภาพรวมถ่านหิน
Coala ระบุตัวแทนภาษาที่เริ่มต้นด้วย พื้นที่ปฏิบัติการ ซึ่งมี 2 ส่วน:
- การกระทำภายนอกเพื่อโต้ตอบกับสภาพแวดล้อมภายนอก ( การต่อสายดิน )
- การกระทำภายในเพื่อโต้ตอบกับความทรงจำภายใน ( การใช้เหตุผล การดึง การเรียนรู้ )
- ตัวแทนภาษามีหน่วยความจำในการทำงานระยะสั้นและความทรงจำระยะยาว (เป็นทางเลือกมากมาย) (ฉากสำหรับประสบการณ์ความหมายสำหรับความรู้ขั้นตอนสำหรับรหัส/LLM)
- การให้เหตุผล = อัปเดตหน่วยความจำการทำงาน (พร้อม LLM)
- Retrieval = อ่านหน่วยความจำระยะยาว
- การเรียนรู้ = เขียนหน่วยความจำระยะยาว

แล้วตัวแทนภาษาจะเลือกการกระทำที่จะดำเนินการอย่างไร การกระทำของมันถูกจัดโครงสร้างใน การตัดสินใจ รอบและแต่ละรอบมีสองขั้นตอน:
- การวางแผน : ตัวแทนใช้การดำเนินการด้วยเหตุผล/การเรียกคืนกับ (ซ้ำ ๆ ) เสนอและประเมินการกระทำจากนั้นเลือกการเรียนรู้/การลงดิน
- การดำเนินการ : การกระทำการเรียนรู้/การต่อสายดินที่เลือกจะถูกดำเนินการเพื่อส่งผลกระทบต่อหน่วยความจำภายในหรือโลกภายนอก

เพื่อทำความเข้าใจเพิ่มเติมให้อ่านส่วนที่ 4 ของบทความของเรา
เอกสาร
ด้านล่างนี้เป็นเพียงส่วนย่อยของเอกสารที่ถูกคัดลอกมาจาก Coala.bib Plus คำขอที่ดึงมาพร้อมกับฉลากพื้นที่การกระทำที่ไม่ถูกต้อง วันที่ขึ้นอยู่กับ Arxiv V1 พวกเขาไม่ได้เป็นตัวแทนของงานตัวแทนภาษาทั้งหมดและเราวางแผนที่จะเพิ่มงานมากขึ้นในไม่ช้า (ยินดีต้อนรับการร้องขอดึง) และมีป้ายกำกับสำหรับงานที่ได้รับการอ้างถึงสูง
- (2021-10) AI โซ่: การมีปฏิสัมพันธ์ระหว่างมนุษย์กับมนุษย์ที่โปร่งใสและควบคุมได้โดยการผูกมัดแบบจำลองภาษาขนาดใหญ่ (การให้เหตุผล)
- (2021-10) SILG: เกณฑ์มาตรฐานการกราวด์แบบอินเทอร์แอคทีฟแบบหลายสภาพแวดล้อม (สภาพแวดล้อม)
- (2022-01) แบบจำลองภาษาในฐานะนักวางแผนการช็อตศูนย์: สกัดความรู้ที่สามารถดำเนินการได้สำหรับตัวแทนที่เป็นตัวเป็นตน (สายดิน)
- (2022-03) Prettchainer: การผูกมัดแบบจำลองภาษาขนาดใหญ่พร้อมผ่านการเขียนโปรแกรมด้วยภาพ (การต่อสายดิน)
- (2022-03) ScienceWorld: ตัวแทนของคุณฉลาดกว่านักเรียนชั้นประถมศึกษาปีที่ 5 หรือไม่? (สิ่งแวดล้อม)
- (2022-04) ทำเท่าที่จะทำได้ไม่ใช่อย่างที่ฉันพูด: ภาษาพื้นฐานในการจ่ายหุ่นยนต์ (ดิน)
- (2022-04) โมเดล Socratic: การแต่งการใช้เหตุผลแบบหลายรูปแบบเป็นศูนย์ด้วยภาษา (Grounding)
- (2022-07) Webshop: ไปสู่การโต้ตอบเว็บในโลกแห่งความเป็นจริงกับตัวแทนภาษาที่มีเหตุผล (สภาพแวดล้อม)
- (2022-09) ProgPrompt: การสร้างแผนงานหุ่นยนต์ที่ตั้งอยู่โดยใช้แบบจำลองภาษาขนาดใหญ่ (สายดิน)
- (2022-10) การตอบสนองที่ย่อยสลาย: วิธีการแบบแยกส่วนสำหรับการแก้ปัญหาที่ซับซ้อน (การใช้เหตุผล)
- (2022-10) ความคิดของจิตใจ: แบบจำลองภาษาที่มีเหตุผลผ่านการจำลอง (การต่อสายดิน)
- (2022-10) ตอบสนอง: การประสานการใช้เหตุผลและการแสดงในแบบจำลองภาษา (การต่อสายดินการใช้เหตุผล)
- (2022-11) แบบจำลองภาษาขนาดใหญ่เป็นวิศวกรที่มีระดับมนุษย์ (การใช้เหตุผล)
- (2022-12) LLM-Planner: การวางแผนที่มีพื้นฐานไม่กี่นัดสำหรับตัวแทนที่เป็นตัวเป็นตนด้วยรูปแบบภาษาขนาดใหญ่ (สายดิน)
- (2022-12) อย่าสร้าง, แยกแยะ: ข้อเสนอสำหรับแบบจำลองภาษาที่ต่อสายดินกับสภาพแวดล้อมในโลกแห่งความเป็นจริง (สายดิน)
- (2023-02) ห่วงโซ่ของ Hindsight จัดรูปแบบภาษากับข้อเสนอแนะ (การเรียนรู้)
- (2023-02) อธิบายอธิบายวางแผนและเลือก: การวางแผนแบบโต้ตอบกับแบบจำลองภาษาขนาดใหญ่ช่วยให้ตัวแทนหลายงานเปิดกว้าง (การต่อสายดิน, การใช้เหตุผล)
- (2023-02) Toolformer: แบบจำลองภาษาสามารถสอนตัวเองให้ใช้เครื่องมือ (สายดิน)
- (2023-03) แบบจำลองพื้นฐานสำหรับการตัดสินใจ: ปัญหาวิธีการและโอกาส (สำรวจ)
- (2023-03) HuggingGpt: การแก้ปัญหา AI กับ CHATGPT และเพื่อน ๆ ในการกอดใบหน้า (สายดิน)
- (2023-03) Palm-E: โมเดลภาษาหลายรูปแบบที่เป็นตัวเป็นตน (สายดิน)
- (2023-03) การสะท้อนกลับ: ตัวแทนภาษาที่มีการเรียนรู้การเสริมแรงทางวาจา (การต่อสายดิน, การใช้เหตุผล, การเรียนรู้)
- (2023-03) REFINE ด้วยตนเอง: การปรับแต่งซ้ำ ๆ ด้วยการให้อาหารด้วยตนเอง (การใช้เหตุผล)
- (2023-03) การสร้างรหัสการวางแผนด้วยตนเองด้วยรูปแบบภาษาขนาดใหญ่ (การใช้เหตุผล)
- (2023-04) ตัวแทนกำเนิด: simulacra แบบโต้ตอบของพฤติกรรมมนุษย์ (การต่อสายดิน, การใช้เหตุผล, การดึง, การเรียนรู้)
- (2023-04) ความสามารถในการวิจัยทางวิทยาศาสตร์แบบอิสระของแบบจำลองภาษาขนาดใหญ่ (การลงดินการให้เหตุผล)
- (2023-04) LLM+P: เพิ่มขีดความสามารถของแบบจำลองภาษาขนาดใหญ่ด้วยความสามารถในการวางแผนที่ดีที่สุด (การต่อสายดินการใช้เหตุผล)
- (2023-04) โรงกลั่น: การให้เหตุผลข้อเสนอแนะเกี่ยวกับการเป็นตัวแทนระดับกลาง (การใช้เหตุผล)
- (2023-04) การสอนแบบจำลองภาษาขนาดใหญ่เพื่อลดตัวเอง (การใช้เหตุผล)
- (2023-04) Genegpt: การเพิ่มโมเดลภาษาขนาดใหญ่ด้วยเครื่องมือโดเมนสำหรับการปรับปรุงการเข้าถึงข้อมูลชีวการแพทย์ (การต่อสายดินการให้เหตุผล)
- (2023-05) นักวิจารณ์: โมเดลภาษาขนาดใหญ่สามารถแก้ไขตนเองได้ด้วยการวิพากษ์วิจารณ์เครื่องมือ (การต่อสายดินการใช้เหตุผลการดึงข้อมูล)
- (2023-05) การเพิ่มตัวแทน autotelic ด้วยแบบจำลองภาษาขนาดใหญ่ (การต่อสายดินการใช้เหตุผลการดึงการเรียนรู้)
- (2023-05) แชทคอต: การใช้เหตุผลในการใช้เหตุผลในการใช้ความคิดเกี่ยวกับโมเดลภาษาขนาดใหญ่ที่ใช้การแชท (การต่อสายดิน, การใช้เหตุผล)
- (2023-05) Toolkengpt: การเพิ่มโมเดลภาษาแช่แข็งด้วยเครื่องมือขนาดใหญ่ผ่านเครื่องมือฝังเครื่องมือ (การต่อสายดินการให้เหตุผล)
- (2023-05) การสลายตัวช่วยเพิ่มการใช้เหตุผลผ่านการถอดรหัสการประเมินตนเอง (การใช้เหตุผล)
- (2023-05) ส่งเสริมการคิดที่แตกต่างในรูปแบบภาษาขนาดใหญ่ผ่านการอภิปรายหลายตัวแทน (การต่อสายดินการใช้เหตุผล)
- (2023-05) การปรับปรุงข้อเท็จจริงและการใช้เหตุผลในรูปแบบภาษาผ่านการอภิปรายหลายเจ้านาย (การต่อสายดินการใช้เหตุผล)
- (2023-05) Adaplanner: การวางแผนการปรับตัวจากข้อเสนอแนะกับแบบจำลองภาษา (การต่อสายดิน, การดึง, การเรียนรู้)
- (2023-05) การแจ้งเตือนแผนและการแก้ปัญหา: การปรับปรุงการใช้เหตุผลแบบโซ่-ช็อตแบบไม่ใช้ความคิดด้วยรูปแบบภาษาขนาดใหญ่ (การใช้เหตุผล)
- (2023-05) Rewoo: decoupling การใช้เหตุผลจากการสังเกตสำหรับแบบจำลองภาษาที่เพิ่มประสิทธิภาพ (การต่อสายดินการใช้เหตุผล)
- (2023-05) SwiftSage: ตัวแทนกำเนิดที่มีการคิดอย่างรวดเร็วและช้าสำหรับงานเชิงโต้ตอบที่ซับซ้อน (การต่อสายดินการใช้เหตุผล)
- (2023-05) ต้นไม้แห่งความคิด: การแก้ปัญหาโดยเจตนาด้วยแบบจำลองภาษาขนาดใหญ่ (การใช้เหตุผล)
- (2023-05) Voyager: ตัวแทนที่เป็นตัวเป็นตนปลายเปิดที่มีรูปแบบภาษาขนาดใหญ่ (การต่อสายดิน, การใช้เหตุผล, การดึง, การเรียนรู้)
- (2023-06) Intercode: การกำหนดมาตรฐานและการเปรียบเทียบการเข้ารหัสแบบโต้ตอบกับข้อเสนอแนะการดำเนินการ (การต่อสายดินการให้เหตุผล)
- (2023-06) ToolQa: ชุดข้อมูลสำหรับการตอบคำถาม LLM ด้วยเครื่องมือภายนอก (Grounding)
- (2023-06) Mind2Web: ไปสู่ตัวแทนทั่วไปสำหรับเว็บ (สภาพแวดล้อม)
- (2023-06) RESTGPT: การเชื่อมต่อโมเดลภาษาขนาดใหญ่กับ APIs RESTFUL ในโลกแห่งความเป็นจริง (การต่อสายดินการใช้เหตุผล)
- (2023-06) Toolalpaca: การเรียนรู้เครื่องมือทั่วไปสำหรับแบบจำลองภาษาที่มี 3000 กรณีจำลอง (การต่อสายดินการให้เหตุผล)
- (2023-07) webagent ในโลกแห่งความเป็นจริงที่มีการวางแผนความเข้าใจบริบทที่ยาวนานและการสังเคราะห์โปรแกรม (การต่อสายดินการใช้เหตุผล)
- (2023-07) RT-2: โมเดลแอ็คชั่น Vision-Language-Action ถ่ายโอนความรู้ทางเว็บไปยังการควบคุมหุ่นยนต์ (Grounding)
- (2023-07) ROCO: การทำงานร่วมกันหลายหุ่นยนต์กับแบบจำลองภาษาขนาดใหญ่ (สายดิน)
- (2023-07) หุ่นยนต์ที่ขอความช่วยเหลือ: การจัดตำแหน่งความไม่แน่นอนสำหรับนักวางแผนโมเดลภาษาขนาดใหญ่ (สายดิน)
- (2023-07) S $^3 $: ระบบจำลองเครือข่ายโซเชียลกับตัวแทนที่มีพลังภาษาขนาดใหญ่ (การต่อสายดิน, การใช้เหตุผล)
- (2023-07) TOOLLLM: อำนวยความสะดวกในรูปแบบภาษาขนาดใหญ่เพื่อควบคุม APIs 16000+ โลกแห่งความเป็นจริง (การต่อสายดินการใช้เหตุผลการดึงข้อมูล)
- (2023-07) การทำความเข้าใจถึงประโยชน์และความท้าทายของการใช้ตัวแทนการสนทนาแบบจำลองภาษาขนาดใหญ่สำหรับการสนับสนุนความเป็นอยู่ที่ดีทางจิต (การต่อสายดิน)
- (2023-07) ปลดปล่อยการทำงานร่วมกันทางปัญญาในรูปแบบภาษาขนาดใหญ่: ตัวแทนการแก้งานผ่านการรวมตัวกันหลายคน (การลงดินการใช้เหตุผล)
- (2023-07) WebArena: สภาพแวดล้อมเว็บที่สมจริงสำหรับการสร้างตัวแทนอิสระ (สภาพแวดล้อม)
- (2023-08) Agentbench: การประเมิน LLMS เป็นตัวแทน (สภาพแวดล้อม)
- (2023-08) Agentverse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉินในตัวแทน (สิ่งแวดล้อม)
- (2023-08) Autogen: การเปิดใช้งานแอปพลิเคชัน LLM รุ่นต่อไปผ่านกรอบการสนทนาหลายตัวแทน (การต่อสายดินการให้เหตุผล)
- (2023-08) CGMI: กรอบการโต้ตอบหลายตัวแทนทั่วไปที่กำหนดค่าได้ (การต่อสายดินการให้เหตุผล)
- (2023-08) Chateval: ไปสู่ผู้ประเมินที่ใช้ LLM ที่ดีขึ้นผ่านการอภิปรายหลายตัวแทน (การต่อสายดินการใช้เหตุผล)
- (2023-08) การใช้เหตุผลสะสมด้วยแบบจำลองภาษาขนาดใหญ่ (การใช้เหตุผล)
- (2023-08) Expel: ตัวแทน LLM เป็นผู้เรียนรู้จากประสบการณ์ (การต่อสายดินการใช้เหตุผลการดึงการเรียนรู้)
- (2023-08) GPT-in-the-loop: การตัดสินใจแบบปรับตัวสำหรับระบบหลายหน่วยงาน (การต่อสายดินการใช้เหตุผล)
- (2023-08) Gentopia: แพลตฟอร์มการทำงานร่วมกันสำหรับ LLMs ที่มีการเสริมเครื่องมือ (สภาพแวดล้อม)
- (2023-08) MetAgpt: การเขียนโปรแกรมเมตาสำหรับกรอบการทำงานร่วมกันแบบหลายตัวแทน (การต่อสายดินการใช้เหตุผล)
- (2023-08) Proagent: การสร้าง AI สหกรณ์เชิงรุกกับแบบจำลองภาษาขนาดใหญ่ (การต่อสายดินการใช้เหตุผล)
- (2023-08) Retroformer: ตัวแทนภาษาขนาดใหญ่ย้อนหลังพร้อมการเพิ่มประสิทธิภาพการไล่ระดับสีเชิงนโยบาย (การต่อสายดินการใช้เหตุผลการเรียนรู้)
- (2023-08) Sapien: ตัวแทนเสมือนจริงที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ (การต่อสายดิน, การใช้เหตุผล)
- (2023-08) การรวมกันของแบบจำลองภาษาขนาดใหญ่และสถาปัตยกรรมทางปัญญาสำหรับ AI ที่แข็งแกร่ง: การวิเคราะห์เชิงสำรวจ (การต่อสายดินการใช้เหตุผลการดึงการเรียนรู้)
- (2023-09) TORA: ตัวแทนการใช้เหตุผลแบบบูรณาการเครื่องมือสำหรับการแก้ปัญหาทางคณิตศาสตร์ (การต่อสายดินการใช้เหตุผลการเรียนรู้)
- (2023-09) การระบุความเสี่ยงของตัวแทน LM ด้วย Sandbox ที่ได้รับการตกแต่งด้วย LM (สภาพแวดล้อม)
- (2023-09) ตัวแทนความสงสัย: เล่นเกมข้อมูลที่ไม่สมบูรณ์ด้วยทฤษฎีของจิตใจตระหนักถึง GPT-4 (การต่อสายดินการใช้เหตุผล)
- (2024-01) คอนทราสต์ตนเอง: การสะท้อนที่ดีขึ้นผ่านมุมมองการแก้ปัญหาที่ไม่สอดคล้องกัน (การใช้เหตุผลการสะท้อน)
- (2024-02) Agent-Pro: การเรียนรู้ที่จะพัฒนาผ่านการสะท้อนและการเพิ่มประสิทธิภาพระดับนโยบาย (การใช้เหตุผลการสะท้อนการเรียนรู้)
- (2024-03) LLM3: งานแบบจำลองภาษาขนาดใหญ่และการวางแผนการเคลื่อนไหวด้วยการให้เหตุผลการเคลื่อนไหวล้มเหลว (วางแผนการใช้เหตุผล)
- (2024-04) เพิ่มขีดความสามารถในการค้นพบชีวการแพทย์กับตัวแทน AI (นักวิทยาศาสตร์ AI, การวิจัยทางชีวการแพทย์)
- (2024-05) TimeChara: การประเมินภาพหลอนของตัวละครในเวลาของการเล่นแบบจำลองภาษาขนาดใหญ่ (การใช้เหตุผลการดึงข้อมูล)
(เพิ่มเติมที่จะเพิ่มเร็ว ๆ นี้ยินดีต้อนรับการร้องขอการร้องขอ)
ทรัพยากร
- LLM ขับเคลื่อนตัวแทนอิสระ (lil'log)
- LLM-agents-papers
- llmagentpapers
- Awesome-LLM-powered-agent
(เพิ่มเติมที่จะเพิ่มเร็ว ๆ นี้ยินดีต้อนรับการร้องขอการร้องขอ)