ตัวแทนที่ขับเคลื่อนด้วย LLM ที่ยอดเยี่ยม
ด้วยความสามารถในการวางแผนการใช้เหตุผลและการเรียกเครื่องมือที่น่าประทับใจของแบบจำลองภาษาขนาดใหญ่ (LLMS) ผู้คนกำลังศึกษาและพัฒนา ตัวแทนที่ขับเคลื่อนด้วย LLM อย่างแข็งขัน ตัวแทนเหล่านี้เป็นไปได้ที่จะช่วยแก้ปัญหาที่ซับซ้อนหรือจำลองการปฏิสัมพันธ์ของมนุษย์อย่างอิสระ (และร่วมมือกัน)
เป้าหมายของเรากับโครงการนี้คือการสร้างคอลเล็กชั่นทรัพยากรที่ยอดเยี่ยมที่เกี่ยวข้องกับตัวแทนที่ขับเคลื่อนด้วย LLM ซึ่งครอบคลุมเอกสารที่เก็บและอื่น ๆ เรามุ่งมั่นที่จะปรับปรุงสิ่งเหล่านี้อย่างสม่ำเสมอและต่อเนื่อง เราขอขอบคุณการมีส่วนร่วมใด ๆ ผ่าน PRS ปัญหาอีเมลหรือวิธีการอื่น ๆ
โปรดทราบว่าที่เก็บนี้ไม่ได้อยู่ภายใต้การบำรุงรักษาที่ใช้งานอยู่ ส่วนใหญ่มีเอกสารที่ปรากฏก่อนตุลาคม 2023 โดยมีเอกสารเพิ่มเติมหลายฉบับ หากคุณต้องการรวมกระดาษของคุณโปรดอย่าลังเลที่จะเริ่มคำขอดึง
- เอกสาร
- นักแก้ปัญหางานอิสระ
- การใช้เหตุผลทั่วไปและการวางแผนและเครื่องมือโดยใช้
- ความร่วมมือหลายตัวแทน
- เฟรมเวิร์กและโอเพ่นซอร์ส
- แอปพลิเคชัน
- ตัวแทนเว็บ
- ตัวแทน RL
- Robotics & embodied AI
- การเล่นเกมและการสวมบทบาท
- แอปพลิเคชันอื่น ๆ
- น่าเชื่อถือ
- การจำลองปฏิสัมพันธ์ของมนุษย์
- การมีปฏิสัมพันธ์กับมนุษย์-ตัวแทน
- LLM ที่ขับเคลื่อนด้วยตัวแทน
- เกณฑ์มาตรฐาน
- การสำรวจและการสอน
- โครงการโอเพ่นซอร์ส
- โครงการแก้ปัญหาอิสระ
- โครงการจำลองหลายตัวแทน
- มุมมอง
- แหล่งข้อมูลอื่น ๆ ที่เกี่ยวข้อง
- การรับทราบ
เอกสาร
สำหรับเอกสารที่มี> 50 การอ้างอิงหรือที่เก็บด้วย> 200 ดาว
สำหรับเอกสารที่ได้รับการยอมรับจากการประชุม/วารสารที่มีชื่อเสียง
นักแก้ปัญหางานอิสระ
การใช้เหตุผลทั่วไปและการวางแผนและเครื่องมือโดยใช้
- [พฤษภาคม 2024] "การฝึกอบรมแบบออฟไลน์ของตัวแทนรูปแบบภาษาที่มีฟังก์ชั่นเป็นน้ำหนักที่เรียนรู้ได้" Shaokun Zhang (PSU) และคณะ ICML 2024. [กระดาษ] [รหัส]
- [มี.ค. 2024] "Agent-Flan: การออกแบบข้อมูลและวิธีการปรับจูนเอเจนต์ที่มีประสิทธิภาพสำหรับโมเดลภาษาขนาดใหญ่" Zehui Chen (USTC) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ธ.ค. 2023] "Clova: ผู้ช่วยภาพวงปิดพร้อมการใช้เครื่องมือและการอัปเดต" Zhi Gao (Bigai) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ธ.ค. 2023] "Saycanpay: การวางแผนฮิวริสติกด้วยแบบจำลองภาษาขนาดใหญ่โดยใช้ความรู้โดเมนที่เรียนรู้ได้" Rishi Hazra และคณะ AAAI 2024 [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "การค้นหาต้นไม้ตัวแทนภาษารวมการใช้เหตุผลการแสดงและการวางแผนในรูปแบบภาษา" Andy Zhou (UIUC) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "แบบจำลองภาษาขนาดใหญ่ยังไม่สามารถให้เหตุผลแก้ไขได้ด้วยตนเอง" Jie Huang (UIUC) และคณะ ICLR 2024. [กระดาษ]
- [ต.ค. 2023] "ปรับตัวแทน LLM ผ่านการสื่อสาร" Kuan Wang (Gatech & Microsoft) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "Toolchain*: การนำทางพื้นที่การกระทำที่มีประสิทธิภาพในรูปแบบภาษาขนาดใหญ่ที่มี A* Search" Yuchen Zhuang (Gatech & Adobe) และคณะ ICLR 2024. [กระดาษ]
- [ก.ย. 2023] "Avis: การค้นหาข้อมูลภาพอิสระด้วยแบบจำลองภาษาขนาดใหญ่" Ziniu Hu (Google) และคณะ Neurips 2023. [กระดาษ]
- [ก.ย. 2023] "เหตุผลสำหรับอนาคตทำหน้าที่ตอนนี้: กรอบหลักการสำหรับตัวแทน LLM อิสระที่มีประสิทธิภาพตัวอย่างที่พิสูจน์ได้" Zhihan Liu (Northwestern) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "การลงดินที่ขับเคลื่อนด้วยตนเอง: เอเจนต์แบบจำลองภาษาขนาดใหญ่ที่มีการเรียนรู้ทักษะที่สอดคล้องกับภาษาอัตโนมัติ" Shaohui Peng (CAS) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "Expel: ตัวแทน LLM เป็นผู้เรียนรู้จากประสบการณ์" Andrew Zhao (Thu) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "การรวมกันของแบบจำลองภาษาขนาดใหญ่และสถาปัตยกรรมทางปัญญาสำหรับ AI ที่แข็งแกร่ง: การวิเคราะห์เชิงสำรวจ" Oscar J. Romero (CMU) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "การวางแผนแบบไดนามิกด้วย LLM" Gautier Dagan (U of Edinburgh) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "Retroformer: ตัวแทนภาษาขนาดใหญ่ย้อนหลังพร้อมการเพิ่มประสิทธิภาพการไล่ระดับสีของนโยบาย" Weiran Yao (Salesforce) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "Rewoo: การแยกเหตุผลจากการสังเกตสำหรับโมเดลภาษาที่เพิ่มประสิทธิภาพ" Binfeng Xu และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "SwiftSage: ตัวแทนกำเนิดที่มีการคิดอย่างรวดเร็วและช้าสำหรับงานที่ซับซ้อน" Bill Yuchen Lin (AI2) และคณะ Neurips 2023 [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2023] "Adaplanner: การวางแผนแบบปรับตัวจากข้อเสนอแนะกับแบบจำลองภาษา" Haotian Sun (Gatech) และคณะ Neurips 2023. [กระดาษ] [รหัส]
- [พฤษภาคม 2022] "การให้เหตุผลกับรูปแบบภาษากำลังวางแผนกับโมเดลโลก" Shibo Hao (UCSD) และคณะ EMNLP 2023. [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2023] "การใช้ประโยชน์จากแบบจำลองภาษาขนาดใหญ่ที่ผ่านการฝึกอบรมมาก่อนเพื่อสร้างและใช้โมเดลโลกสำหรับการวางแผนงานตามแบบจำลอง" Lin Guan (ASU) และคณะ Neurips 2023 [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2023] "แชทคอต: การให้เหตุผลที่หลากหลายในการใช้เหตุผลในการใช้งานแบบจำลองภาษาขนาดใหญ่ที่ใช้การแชท" Zhipeng Chen (RUC) และคณะ EMNLP 2023 การค้นพบ [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "นักวิจารณ์: แบบจำลองภาษาขนาดใหญ่สามารถแก้ไขตนเองได้ด้วยการวิพากษ์วิจารณ์แบบไม่โต้ตอบด้วยเครื่องมือ" Zhibin Gou (Thu & Microsoft) และคณะ arxiv. [กระดาษ] [รหัส]
- [เม.ย. 2023] "LLM+P: เพิ่มขีดความสามารถของแบบจำลองภาษาขนาดใหญ่ด้วยความสามารถในการวางแผนที่ดีที่สุด" Bo Liu (UT Austin) และคณะ arxiv. [กระดาษ] [รหัส]
- [มี.ค. 2023] "การสะท้อนกลับ: ตัวแทนภาษาที่มีการเรียนรู้การเสริมแรงทางวาจา" Noah Shinn (Northeastern) และคณะ Neurips 2023. [กระดาษ] [รหัส]
- [ธ.ค. 2022] "อย่าสร้าง, แยกแยะ: ข้อเสนอสำหรับแบบจำลองภาษากับสภาพแวดล้อมในโลกแห่งความเป็นจริง" Yu Gu (OSU) และคณะ ACL 2023. [กระดาษ] [รหัส]
- [ต.ค. 2022] "ตอบสนอง: การรวมเหตุผลและการแสดงในรูปแบบภาษา" Shunyu Yao (Princeton & Google Brain) และคณะ ICLR 2023. [กระดาษ] [รหัส] [หน้าโครงการ]
ความร่วมมือหลายตัวแทน
- [ส.ค. 2024] "Megaagent: กรอบการปฏิบัติสำหรับความร่วมมือแบบอิสระในระบบตัวแทน LLM ขนาดใหญ่" Qian Wang (NUS) et al.* arxiv [กระดาษ]
- [พฤษภาคม 2024] "ความสอดคล้อง, confabulation และการแอบอ้าง: ความไม่แน่นอนของบุคคลในการทำงานร่วมกัน LLM หลายตัวแทน" Razan Baltaji (UIUC) et al.* arxiv [กระดาษ] [รหัส]
- [เมษายน 2024] "Comm: การทำงานร่วมกันหลายตัวแทนแบบหลายเหตุผลการกระตุ้นการแก้ปัญหาที่ซับซ้อน" Pei Chen (Tamu) et al.* Naacl 2024. [กระดาษ] [รหัส]
- [ม.ค. 2024] "L2MAC: คอมพิวเตอร์โมเดลอัตโนมัติขนาดใหญ่สำหรับการสร้างรหัสที่กว้างขวาง" ซามูเอลโฮลท์ (เคมบริดจ์) และคณะ ICLR 2024. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "การประเมินความสามารถในการประสานงานหลายตัวแทนในรูปแบบภาษาขนาดใหญ่" Saaket Agashe (UCSC) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "เครือข่าย LLM-Agent แบบไดนามิก: กรอบการทำงานร่วมกัน LLM-Agent พร้อมการเพิ่มประสิทธิภาพทีมตัวแทน" Zijun Liu (Thu & Stanford) และคณะ arxiv. [กระดาษ] [รหัส]
- [ต.ค. 2023] "การสำรวจกลไกการทำงานร่วมกันสำหรับตัวแทน LLM: มุมมองจิตวิทยาสังคม" Jintian Zhang (Zju) และคณะ arxiv. [กระดาษ] [รหัส]
- [ต.ค. 2023] "Corex: การผลักดันขอบเขตของการใช้เหตุผลที่ซับซ้อนผ่านการทำงานร่วมกันแบบหลายรูปแบบ" Qiushi Sun (Shanghai Ai Lab & Nus) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "LLM-deliberation: การประเมิน LLMs ด้วยเกมการเจรจาต่อรองหลายตัวแทนแบบโต้ตอบ" Sahar Abdelnabi (CISPA) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "การทำงานร่วมกันแบบหลายหุ่นยนต์ที่ปรับขนาดได้กับแบบจำลองภาษาขนาดใหญ่: ระบบส่วนกลางหรือการกระจายอำนาจ?" Yongchao Chen (MIT & Harvard) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "กระทบยอด: การประชุมรอบโต๊ะช่วยปรับปรุงการใช้เหตุผลผ่านฉันทามติในหมู่ LLM ที่หลากหลาย" Justin Chih-Yao Chen (UNC Chapel Hill) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "Mindagent: การโต้ตอบเกมฉุกเฉิน" Xiaojian MA (Bigai) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ส.ค. 2023] "Proagent: การสร้าง AI สหกรณ์เชิงรุกพร้อมรูปแบบภาษาขนาดใหญ่" Ceyao Zhang (Cuhk & Pku) และคณะ arxiv. [กระดาษ] [หน้าโครงการ]
- [ส.ค. 2023] "Agentverse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉินในตัวแทน" Weize Chen (Thu) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "GPT-in-the-loop: การตัดสินใจแบบปรับตัวสำหรับระบบหลายหน่วยงาน" Nathalia Nascimento (U of Waterloo) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "LLMs มีความอ่อนไหวต่อการเข้าใจผิดแบบตรรกะอย่างไร" Amirreza Payandeh (GMU & VAIL Systems) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "Chateval: ไปสู่ผู้ประเมินที่ใช้ LLM ที่ดีขึ้นผ่านการอภิปรายหลายตัวแทน" Chi-Min Chan (Thu) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "LLM เป็น DBA" Xuanhe Zhou (Thu) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "Gentopia: แพลตฟอร์มการทำงานร่วมกันสำหรับ LLMs ที่มีการเสริมเครื่องมือ" Binfeng Xu และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ส.ค. 2023] "MetAgpt: การเขียนโปรแกรมเมตาสำหรับกรอบการทำงานร่วมกันหลายตัวแทน" Sirui Hong (Deepwisdom) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ค. 2023] "PRD: อันดับเพื่อนและการอภิปรายปรับปรุงการประเมินแบบจำลองภาษาขนาดใหญ่" Ruosen Li (UT Dallas) และคณะ arxiv. [กระดาษ] [หน้าโครงการ] [รหัส]
- [กรกฎาคม 2023] "ปลดปล่อยการทำงานร่วมกันทางปัญญาในรูปแบบภาษาขนาดใหญ่: ตัวแทนการแก้งานผ่านการรวมตัวของตัวเองหลายคน" Zhenhailong Wang (UIUC & MSRA) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ค. 2023] "Roco: การทำงานร่วมกันหลายหุ่นยนต์กับโมเดลภาษาขนาดใหญ่" Mandi Zhao (โคลัมเบีย) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ค. 2023] "AI ไร้สายแบบไร้สาย: จากหน่วยสืบราชการลับที่เชื่อมต่อไปจนถึงหน่วยสืบราชการลับร่วมกัน" Hang Zou (สถาบันเทคโนโลยีนวัตกรรม, UAE) และคณะ arxiv. [กระดาษ]
- [กรกฎาคม 2023] "การสร้างความร่วมมือเป็นตัวแทนตัวแทนอย่างเป็นโมดูลด้วยแบบจำลองภาษาขนาดใหญ่" Hongxin Zhang (UMass) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [มิ.ย. 2023] "RESTGPT: การเชื่อมต่อโมเดลภาษาขนาดใหญ่กับแอปพลิเคชันในโลกแห่งความเป็นจริงผ่าน RESTFUL APIs" Yifan Song (PKU) และคณะ arxiv. [กระดาษ] [หน้าโครงการ]
- [มิ.ย. 2023] "การทำงานร่วมกันหลายตัวแทน: การควบคุมพลังของตัวแทน LLM อัจฉริยะ" Yashar Talebirad (Ualberta) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "ส่งเสริมการคิดที่แตกต่างในรูปแบบภาษาขนาดใหญ่ผ่านการอภิปรายหลายตัวแทน" Tian Liang (Thu & Tencent) และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "โมเดลภาษาขนาดใหญ่เป็นผู้ผลิตเครื่องมือ" Tianle Cai (Deepmind & Princeton) และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "การปรับปรุงข้อเท็จจริงและการใช้เหตุผลในรูปแบบภาษาผ่านการอภิปรายหลายหน่วยงาน" Yilun du (MIT) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2023] "ข้อตกลงและประสิทธิภาพทางสถิติในรูปแบบการรับรู้แบบเบย์" Yash Deshpande (MIT) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "การปรับปรุงการเจรจาต่อรองรูปแบบภาษาด้วยการเล่นด้วยตนเองและการเรียนรู้ในบริบทจากข้อเสนอแนะ AI" Yao Fu (U of Edinburgh) และคณะ arxiv. [กระดาษ] [รหัส]
เฟรมเวิร์กและโอเพ่นซอร์ส
- [ต.ค. 2023] "OpenAgents: แพลตฟอร์มเปิดสำหรับตัวแทนภาษาในป่า" Tianbao Xie (Hku & Xlang Lab) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "autoagents: กรอบสำหรับการสร้างเอเจนต์อัตโนมัติ" Guangyao Chen (PKU) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "ตัวแทน: กรอบโอเพนซอร์ซสำหรับตัวแทนภาษาอิสระ" Wangchunshu Zhou (Ai Waves) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "สถาปัตยกรรมทางปัญญาสำหรับตัวแทนภาษา" Theodore Sumers (Princeton) และคณะ arxiv. [กระดาษ] [repo]
- [ส.ค. 2023] "Autogen: เปิดใช้งานแอปพลิเคชัน LLM รุ่นต่อไปผ่านกรอบการสนทนาหลายตัวแทน" Qingyun Wu et al. arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ส.ค. 2023] "Fastagency: วิธีที่เร็วที่สุดในการนำเวิร์กโฟลว์หลายตัวแทนมาสู่การผลิต" Davor Runje และคณะ [รหัส] [หน้าโครงการ]
แอปพลิเคชัน
ตัวแทนเว็บ
- [ก.ย. 2023] "คุณดูที่หน้าจอเท่านั้น: เอเจนต์โซ่ของแอ็คชั่นหลายรูปแบบ" Zhuosheng Zhang (SJTU) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "เลเซอร์: เอเจนต์ LLM พร้อมการสำรวจพื้นที่ของรัฐสำหรับการนำทางเว็บ" Kaixin MA (Tencent) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ค. 2023] "Webarena: สภาพแวดล้อมเว็บที่สมจริงสำหรับการสร้างตัวแทนอิสระ" Shuyan Zhou (CMU) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [กรกฎาคม 2023] "เว็บเจนต์ในโลกแห่งความเป็นจริงพร้อมการวางแผนความเข้าใจบริบทที่ยาวนานและการสังเคราะห์โปรแกรม" Izzeddin Gur (DeepMind) และคณะ arxiv. [กระดาษ]
- [มิ.ย. 2023] "Mind2Web: ไปสู่ตัวแทนทั่วไปสำหรับเว็บ" Xiang Deng (OSU) และคณะ Neurips 2023 [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2023] "การเพิ่มตัวแทน autotelic ด้วยโมเดลภาษาขนาดใหญ่" Cédric Colas (MIT & INRIA) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "Mobile-ENV: แพลตฟอร์มการประเมินและมาตรฐานสำหรับตัวแทนเชิงโต้ตอบใน ERA LLM" Danyang Zhang (SJTU) และคณะ arxiv. [กระดาษ] [รหัส]
- [เม.ย. 2023] "ความสามารถในการวิจัยทางวิทยาศาสตร์แบบอิสระของแบบจำลองภาษาขนาดใหญ่" Daniil A. Boiko (CMU) และคณะ arxiv. [กระดาษ]
- [มี.ค. 2023] "โมเดลภาษาสามารถแก้ปัญหางานคอมพิวเตอร์ได้" Geunwoo Kim (UCI) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ค. 2022] "Webshop: ไปสู่การโต้ตอบเว็บในโลกแห่งความเป็นจริงกับตัวแทนภาษาที่มีเหตุผล" Shunyu Yao (Princeton) และคณะ Neurips 2022. [Paper] [Code] [Project Page]
ตัวแทน RL
- [พฤษภาคม 2024] "การค้นพบทักษะตัวแทน" Xufeng Zhao (UHH) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2024] "Intelligent Go-Explore: ยืนอยู่บนไหล่ของโมเดลรากฐานยักษ์" Cong Lu (UBC) และคณะ arxiv. [กระดาษ]
- [พ.ย. 2023] "LAFITE-RL:" เร่งการเรียนรู้การเสริมแรงของการจัดการหุ่นยนต์ผ่านข้อเสนอแนะจากรูปแบบภาษาขนาดใหญ่ " Kun Chu (UHH) และคณะ CRL WS @ Corl 2023. [กระดาษ]
- [ต.ค. 2023] "motif: แรงจูงใจที่แท้จริงจากการตอบรับปัญญาประดิษฐ์" Martin Klissarov (Mila & Meta & McGill) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "RLADAPTER: การเชื่อมโยงแบบจำลองภาษาขนาดใหญ่เพื่อเสริมการเรียนรู้ในโลกเปิด" Wanpeng Zhang (PKU) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "LAGN-SEQ: การเรียนรู้การเสริมแรงแบบนำทางด้วยภาษาด้วยการสืบค้นตัวอย่างที่มีประสิทธิภาพ" Thommen George Karimpanal (Deakin University) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ค. 2023] "การสนทนาการสร้าง: เสริมพลังตัวแทนผ่านการโต้ตอบ NPC" Wei Zhou (Gatech) และคณะ arxiv. [กระดาษ]
- [กรกฎาคม 2023] "ไปสู่ตัวแทนที่เป็นเอกภาพด้วยโมเดลพื้นฐาน" Norman Di Palo (ICL & DeepMind) และคณะ กลับชาติมาเกิด RL @ ICLR 2023. [กระดาษ]
- [มิ.ย. 2023] "รูปแบบภาษาขนาดใหญ่เป็นตัวแทนการเรียนรู้การเสริมแรงแบบกึ่งพารามิเตอร์" Danyang Zhang (SJTU) และคณะ Neurips 2023. [กระดาษ]
- [พฤษภาคม 2023] "การสลายตัวของงานที่มีความหมายในการเรียนรู้การเสริมแรงแบบหลายตัวแทน" Wenhao Li (Cuhk) และคณะ arxiv. [กระดาษ]
Robotics & embodied AI
- [พ.ย. 2024] "ตัวแทนแรงงาน: แบบจำลองภาษาขนาดใหญ่สำหรับการเตรียมหุ่นยนต์ bimanual" , Kun Chu (UHH) และคณะ Humanoids 2024. [Paper] [เว็บไซต์], [รหัส]
- [ก.ค. 2024] "Odyssey: เสริมพลังตัวแทนด้วยทักษะการเปิดโลก" Shunyu Liu (มหาวิทยาลัยเจ้อเจียง) และคณะ arxiv. [กระดาษ] [รหัส]
- [พ.ย. 2023] "ลีโอ: ตัวแทนทั่วไปที่เป็นตัวเป็นตนในโลก 3 มิติ" Xiaojian MA (Bigai) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [พ.ย. 2023] "JARVIS-1: เอเจนต์หลายงานแบบเปิดโล่งพร้อมโมเดลภาษาหลายรูปแบบหน่วยความจำที่มีหน่วยความจำ" Zihao Wang (PKU) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "ไปสู่การตัดสินใจที่เป็นตัวเป็นตนแบบ end-to-end ผ่านแบบจำลองภาษาขนาดใหญ่หลายรูปแบบ: การสำรวจด้วย GPT4-Vision และอื่น ๆ " Liang Chen (PKU) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "Lancar: ใช้ประโยชน์จากภาษาสำหรับการเคลื่อนไหวของหุ่นยนต์ที่รับรู้บริบทในสภาพแวดล้อมที่ไม่มีโครงสร้าง" Chak Lam Shek (UMD) และคณะ arxiv. [กระดาษ] [หน้าโครงการ]
- [ก.ย. 2023] "LLM-Grounder: Open-Vocabulary 3D Visual Grounding พร้อมรูปแบบภาษาขนาดใหญ่เป็นตัวแทน" Jianing Yang (Umich) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "Smart-LLM: การวางแผนงานหุ่นยนต์หลายตัวแทนอัจฉริยะโดยใช้แบบจำลองภาษาขนาดใหญ่" Shyam Sundar Kannan (Purdue) และคณะ arxiv. [กระดาษ] [หน้าโครงการ]
- [ก.ย. 2023] "เสียบชิปความปลอดภัย: การบังคับใช้ข้อ จำกัด สำหรับตัวแทนหุ่นยนต์ที่ขับเคลื่อนด้วย LLM" Ziyi Yang และคณะ arxiv. [กระดาษ] [รหัสและวิดีโอ]
- [ก.ย. 2023] "Saynav: แบบจำลองภาษาขนาดใหญ่สำหรับการวางแผนแบบไดนามิกเพื่อนำทางในสภาพแวดล้อมใหม่" Abhinav Rajvanshi (Sri International) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "การพัฒนานั่งร้านด้วยรูปแบบภาษาขนาดใหญ่" M. Batuhan Celik (มหาวิทยาลัย Bogazici) และคณะ arxiv. [กระดาษ]
- [กรกฎาคม 2023] "มีนาคมในการแชท: การแจ้งเตือนแบบโต้ตอบสำหรับนิพจน์อ้างอิงที่เป็นตัวเป็นตนระยะไกล" Yanyuan Qiao (มหาวิทยาลัยแอดิเลด) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "A^2NAV: การนำทางหุ่นยนต์ที่รับรู้ถึงการกระทำโดยใช้ความสามารถในการมองเห็นและการมองเห็นของแบบจำลองพื้นฐาน" Peihao Chen (Scut) และคณะ arxiv. [กระดาษ]
- [ก.ค. 2023] "การวางแผนงานที่เป็นตัวเป็นตนด้วยรูปแบบภาษาขนาดใหญ่" Zhenyu Wu (Bupt) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [มิ.ย. 2023] "การเปิดใช้งานการโต้ตอบอย่างชาญฉลาดระหว่างตัวแทนและ LLM: วิธีการเรียนรู้เสริมแรง" bin Hu (Zhejiang Lab) และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "Ghost in the Minecraft: ตัวแทนที่มีความสามารถโดยทั่วไปสำหรับสภาพแวดล้อมแบบเปิดโลกผ่านแบบจำลองภาษาขนาดใหญ่ที่มีความรู้และหน่วยความจำข้อความ" Xizhou Zhu (Thu & Sensetim) และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "Voyager: ตัวแทนที่เป็นตัวเป็นตนปลายเปิดที่มีรูปแบบภาษาขนาดใหญ่" Guanzhi Wang (Nvidia & Caltech) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [พฤษภาคม 2023] "แผนกำจัดและติดตาม - แบบจำลองภาษาเป็นครูที่ดีสำหรับตัวแทนที่เป็นตัวเป็นตน" Yue Wu (CMU) และคณะ arxiv. [กระดาษ]
- [ก.พ. 2023] "อธิบายอธิบายวางแผนและเลือก: การวางแผนแบบโต้ตอบด้วยแบบจำลองภาษาขนาดใหญ่ช่วยให้ตัวแทนหลายงานเปิดกว้าง" Zihao Wang (PKU) และคณะ Neurips 2023. [กระดาษ] [รหัส]
- [ก.พ. 2023] "การร่วมมือกับแบบจำลองภาษาสำหรับการใช้เหตุผลที่เป็นตัวเป็นตน" Ishita Dasgupta (DeepMind) และคณะ larel @ neurips 2022. [กระดาษ]
- [ม.ค. 2023] "ตัวแทนที่เป็นตัวเป็นตนฝันถึงแกะพิกเซล: การตัดสินใจที่เป็นตัวเป็นตนโดยใช้การสร้างแบบจำลองภาษาโลกที่มีแนวทางภาษา" Kolby Nottingham (UCI) และคณะ ICML 2023. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ธ.ค. 2022] "LLM-Planner: การวางแผนที่มีพื้นฐานไม่กี่นัดสำหรับตัวแทนที่เป็นตัวเป็นตนด้วยรูปแบบภาษาขนาดใหญ่" Chan Hee Song (OSU) และคณะ ICCV 2023. [กระดาษ] [หน้าโครงการ]
การเล่นเกมและการสวมบทบาท
- [พฤษภาคม 2024] "TimeChara: การประเมินภาพหลอนของตัวละครในเวลาของแบบจำลองภาษาขนาดใหญ่ที่สวมบทบาท" Jaewoo Ahn (Snu) และคณะ ผลการวิจัยของ ACL 2024 [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "จากข้อความถึงชั้นเชิง: การประเมิน LLMs เล่นเกม Avalon" Jonathan Light (RPI) และคณะ arxiv. [กระดาษ] [รหัส]
- [ต.ค. 2023] "Ruffle & Riley: ไปสู่การเหนี่ยวนำอัตโนมัติของระบบการสอนการสนทนา" Robin Schmucker (CMU) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "เกมแห่งความคิดของ Avalon: ต่อสู้กับการหลอกลวงผ่านการไตร่ตรองซ้ำ" Shenzhi Wang (Thu) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "Mindagent: การโต้ตอบเกมฉุกเฉิน" Xiaojian MA (Bigai) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "ความสงสัย-ตัวแทน: เล่นเกมข้อมูลที่ไม่สมบูรณ์ด้วยทฤษฎีการรับรู้ GPT-4" Jiaxian Guo (U of Tokyo) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "การผจญภัยโดยรอบ: การสอน CHATGPT เกี่ยวกับการพัฒนาเรื่องราวที่ซับซ้อน" Zexin Chen (Gatech) และคณะ arxiv. [กระดาษ]
- [ก.ค. 2023] "Tachikuma: เข้าใจการโต้ตอบที่ซับซ้อนกับวัตถุหลายตัวละครและวัตถุแปลกใหม่โดยแบบจำลองภาษาขนาดใหญ่" Yuanzhi Liang (UTS) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "สวมบทบาทกับแบบจำลองภาษาขนาดใหญ่" Murray Shanahan (DeepMind & ICL) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "Clembench: การใช้การเล่นเกมเพื่อประเมินโมเดลภาษาที่ปรับให้เหมาะสมเป็นตัวแทนการสนทนา" Kranti Chalamalasetti (University of Potsdam) และคณะ arxiv. [กระดาษ] [รหัส]
- [เม.ย. 2023] "สู่ระบบอัตโนมัติ: ระบบการผลิตแบบแยกส่วนที่ยืดหยุ่นได้รับการปรับปรุงด้วยเอเจนต์แบบจำลองภาษาขนาดใหญ่" Yuchen Xia (มหาวิทยาลัย Stuttgart) และคณะ arxiv. [กระดาษ] [รหัส]
- [มี.ค. 2023] "อูฐ: ตัวแทนสื่อสารสำหรับ" จิตใจ "การสำรวจสังคมแบบจำลองภาษาขนาดใหญ่" Guohao Li (Kaust) และคณะ Neurips 2023 [กระดาษ] [รหัส] [หน้าโครงการ]
แอปพลิเคชันอื่น ๆ
- [พฤษภาคม 2024] "Agentclinic: มาตรฐานตัวแทนหลายรูปแบบเพื่อประเมิน AI ในสภาพแวดล้อมทางคลินิกจำลอง" Samuel Schmidgall (Jhu & Stanford) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [เม.ย. 2024] "Clinicalagent: การทดลองทางคลินิกระบบหลายตัวแทนที่มีการใช้เหตุผลแบบจำลองภาษาขนาดใหญ่" Ling Yue (RPI) และคณะ arxiv. [กระดาษ] [รหัส]
- [ม.ค. 2024] "Ehragent: รหัสให้อำนาจแบบจำลองภาษาขนาดใหญ่สำหรับการให้เหตุผลแบบตารางที่ซับซ้อนไม่กี่ครั้งในบันทึกสุขภาพอิเล็กทรอนิกส์" Wenqi Shi (Gatech) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "Optimus: การสร้างแบบจำลองการเพิ่มประสิทธิภาพโดยใช้ตัวแก้ MIP และโมเดลภาษาขนาดใหญ่" Ali Ahmaditeshnizi (Stanford) และคณะ arxiv. [กระดาษ] [รหัส]
- [ต.ค. 2023] "รูปแบบวิวัฒนาการของลักษณะบุคลิกภาพที่เกี่ยวข้องกับพฤติกรรมความร่วมมือโดยใช้แบบจำลองภาษาขนาดใหญ่" Reiji Suzuki (Nagoya University) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "โมเดลภาษาขนาดใหญ่ (LLM) เป็นระบบของตัวแทนผู้เชี่ยวชาญหลายคน: วิธีการแก้ปัญหาความท้าทายที่เป็นนามธรรมและการใช้เหตุผล (ARC)" John Chong Min Tan (NUS) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "แนวทางการใช้ภาษาเพื่อการจัดทฤษฎีบทอย่างเป็นทางการ" Amitayush Thakur (UT Austin) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "ตัวแทนสุขภาพการสนทนา: กรอบตัวแทนที่ขับเคลื่อนด้วย LLM ส่วนบุคคล" Mahyar Abbasian (UCI) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "OceanGPT: แบบจำลองภาษาขนาดใหญ่สำหรับงานวิทยาศาสตร์มหาสมุทร" Zhen Bi (Zju & Donghai Lab) และคณะ arxiv. [กระดาษ] [หน้าโครงการ]
- [ต.ค. 2023] "Voice2action: แบบจำลองภาษาเป็นตัวแทนสำหรับการโต้ตอบแบบเรียลไทม์ที่มีประสิทธิภาพในความเป็นจริงเสมือน" Yang Su (Cornell Tech) arxiv. [กระดาษ]
- [ก.ย. 2023] "Tora: ตัวแทนการใช้เหตุผลแบบรวมเครื่องมือสำหรับการแก้ปัญหาทางคณิตศาสตร์" Zhibin Gou (Thu & Microsoft) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "" สอน AI วิธีการเขียนโค้ด ": การใช้แบบจำลองภาษาขนาดใหญ่เป็นตัวแทนที่สอนได้สำหรับการศึกษาการเขียนโปรแกรม" Hyoungwook Jin (Kaist) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "Surrealdriver: การออกแบบกรอบการจำลองตัวแทนไดรเวอร์ทั่วไปในบริบทของเมืองตามรูปแบบภาษาขนาดใหญ่" Ye Jin (Thu) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "แบบจำลองภาษาขนาดใหญ่เป็นตัวแทนในคลินิก" Nikita Mehandru (UC Berkeley) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "สถาปัตยกรรมโซ่แห่งการอิงกับการประเมินราคาสำหรับตัวแทนเกมรูปแบบภาษาอารมณ์" Maximilian Croissant (Uoy) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "ปลดปล่อยพลังของการเรียนรู้กราฟผ่านตัวแทนอิสระที่ใช้ LLM" Lanning Wei (CAS & 4Paradigm) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "TradingGPT: ระบบหลายตัวแทนที่มีหน่วยความจำเลเยอร์และอักขระที่แตกต่างกันสำหรับประสิทธิภาพการซื้อขายทางการเงินที่เพิ่มขึ้น" หยางหลี่ (นั่ง) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "ModelsCope-Agent: การสร้างระบบตัวแทนที่ปรับแต่งได้ของคุณด้วยโมเดลภาษาขนาดใหญ่โอเพนซอร์ซ" Chenliang Li (Alibaba) และคณะ arxiv. [กระดาษ] [รหัส] [สาธิต]
- [ส.ค. 2023] "ตัวแทน AI ผู้แนะนำ: การรวมโมเดลภาษาขนาดใหญ่สำหรับคำแนะนำแบบโต้ตอบ" Xu Huang (USTC) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "Recmind: เอเจนต์แบบจำลองภาษาขนาดใหญ่สำหรับคำแนะนำ" Yancheng Wang (ASU) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "LLM ขับเคลื่อนการถ่ายโอน SIM-to-Real สำหรับการควบคุมสัญญาณไฟจราจร" Longchao DA (ASU) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "ออกจากกรง: นกแก้วสุ่มชนะในสภาพแวดล้อมการรักษาความปลอดภัยไซเบอร์อย่างไร" Maria Rigaki (čvut) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "มีหลักการทางสังคมสำหรับตัวแทนที่ใช้ LLM หรือไม่?" Jitao Bai (TJU) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "Chateda: โมเดลภาษาขนาดใหญ่ขับเคลื่อนตัวแทนอิสระสำหรับ EDA" Zhuolun He (Cuhk & Shanghai Ai Lab) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "คู่มือการวิเคราะห์โปรแกรมการวิเคราะห์โปรแกรม: การเดินทางด้วยรูปแบบภาษาขนาดใหญ่" Haonan Li (UCR) และคณะ arxiv. [กระดาษ]
- [มิ.ย. 2023] "ไปสู่ตัวแทนการทดสอบอิสระผ่านแบบจำลองภาษาขนาดใหญ่สนทนา" Robert Feldt (Chalmers University of Technology) และคณะ arxiv. [กระดาษ]
- [เม.ย. 2023] "Genegpt: การเพิ่มโมเดลภาษาขนาดใหญ่ด้วยเครื่องมือโดเมนสำหรับการปรับปรุงการเข้าถึงข้อมูลชีวการแพทย์" Qiao Jin, Yifan Yang, Qingyu Chen, Zhiyong Lu Arxiv [กระดาษ] [รหัส]
- [มี.ค. 2023] "HuggingGpt: การแก้ปัญหา AI กับ CHATGPT และเพื่อน ๆ ใน Hugging Face" Yongliang Shen (Zju & Msra) และคณะ arxiv. [กระดาษ] [รหัส]
น่าเชื่อถือ
- [ก.พ. 2024] "เอเจนต์แบบจำลองภาษาขนาดใหญ่สามารถจำลองพฤติกรรมความไว้วางใจของมนุษย์ได้หรือไม่?" Chengxing Xie (Kaust) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ก.ย. 2023] "การระบุความเสี่ยงของตัวแทน LM ด้วย Sandbox ที่ได้รับการยกย่อง LM" Yangjun Ruan (University of Toronto & Vector Institute) และคณะ arxiv. [กระดาษ] [รหัส] [ตัวอย่าง] [หน้าโครงการ]
- [ส.ค. 2023] "เพิ่มความไว้วางใจในตัวแทนระบบอัตโนมัติ AI ที่ใช้ LLM: การพิจารณาใหม่และความท้าทายในอนาคต" Sivan Schwartz (IBM Research) และคณะ อัตโนมัติ @ ijcai 2023. [กระดาษ]
การจำลองปฏิสัมพันธ์ของมนุษย์
- [มี.ค. 2024] "การเกิดขึ้นของบรรทัดฐานทางสังคมในสังคมตัวแทนแบบจำลองภาษาขนาดใหญ่" Siyue Ren (NWPU) และคณะ arxiv. [กระดาษ] [รหัส]
- [ม.ค. 2024] "โมเดลแบบเปิดใจปิด? ในความสามารถของตัวแทนในการเลียนแบบบุคลิกของมนุษย์ผ่านโมเดลภาษาขนาดใหญ่แบบเปิด" Lucio La Cava (มหาวิทยาลัย Calabria) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "Sotopia: การประเมินแบบโต้ตอบสำหรับหน่วยสืบราชการลับทางสังคมในตัวแทนภาษา" *Xuhui Zhou (CMU) และคณะ *ICLR [PAPER]
- [ต.ค. 2023] "Potteai: ทำความเข้าใจกับพฤติกรรมการแข่งขันในตัวแทนที่ใช้โมเดลภาษาขนาดใหญ่" Qinlin Zhao (USTC) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "การจำลองโซเชียลมีเดียโดยใช้แบบจำลองภาษาขนาดใหญ่เพื่อประเมินอัลกอริทึมฟีดข่าวทางเลือก" Petter Törnberg (U of Amsterdam) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "ใส่เงินของคุณในที่ที่ปากของคุณคือ: การประเมินการวางแผนเชิงกลยุทธ์และการดำเนินการของตัวแทน LLM ในเวทีการประมูล" Jiangjie Chen (FDU & AI2) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ต.ค. 2023] "ตัวแทน Lyfe: ตัวแทนกำเนิดสำหรับการปฏิสัมพันธ์ทางสังคมแบบเรียลไทม์ต้นทุนต่ำ" Zhao Kaiya (MIT) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "การระบุความเสี่ยงของตัวแทน LM ด้วย Sandbox ที่ได้รับการยกย่อง LM" Yangjun Ruan (University of Toronto & Vector Institute) และคณะ arxiv. [กระดาษ] [รหัส] [ตัวอย่าง] [หน้าโครงการ]
- [ก.ย. 2023] "การสร้างแบบจำลองที่ใช้ตัวแทนทั่วไป: การเปิดเผยการเปลี่ยนแปลงของระบบสังคมผ่านแบบจำลองกลไกการมีเพศสัมพันธ์กับปัญญาประดิษฐ์กำเนิด" Navid Ghaffarzadegan (Virginia Tech) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "CGMI: กรอบการโต้ตอบหลายตัวแทนทั่วไปที่กำหนดค่าได้" Jinxin Shi (ECNU) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "การสำรวจจุดตัดของแบบจำลองภาษาขนาดใหญ่และการสร้างแบบจำลองตามตัวแทนผ่านวิศวกรรมที่รวดเร็ว" Edward Junprung (UC Berkeley) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "Agentsims: Sandbox โอเพนซอร์ซสำหรับการประเมินแบบจำลองภาษาขนาดใหญ่" Jiaju Lin (PTA Studio & PSU) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [กรกฎาคม 2023] "S^3: ระบบจำลองเครือข่ายโซเชียลกับตัวแทนที่มีพลังภาษาขนาดใหญ่" Chen Gao (Thu) และคณะ arxiv. [กระดาษ]
- [ก.ค. 2023] "คุณอยู่ในการสวมหน้ากากหรือไม่การสำรวจพฤติกรรมและผลกระทบของรูปแบบภาษาขนาดใหญ่ที่ขับเคลื่อนบอทสังคมในเครือข่ายสังคมออนไลน์" Siyu Li (SCU) และคณะ arxiv. [กระดาษ] [ชุดข้อมูล]
- [ก.ค. 2023] "ตัวแทนสื่อสารเพื่อการพัฒนาซอฟต์แวร์" Chen Qian (Thu) และคณะ arxiv. [กระดาษ]
- [ก.ค. 2023] "การสร้างแบบจำลองการแพร่ระบาดของโรคกับตัวแทนกำเนิด" Ross Williams (Virginia Tech) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ค. 2023] "ถึงอินฟินิตี้และเกินกว่า: ตัวแทน Show-1 และ Showrunner ในการจำลองหลายตัวแทน" Philipp Maas (Fable Studio) และคณะ พิมพ์ล่วงหน้า [กระดาษ] [หน้าโครงการ]
- [มิ.ย. 2023] "Recagent: กระบวนทัศน์การจำลองแบบใหม่สำหรับระบบผู้แนะนำ" Lei Wang (RUC) และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "เล่นเกมซ้ำ ๆ ด้วยโมเดลภาษาขนาดใหญ่" Elif Akata (U of Tübingen) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "บทบาทของการสรุปในตัวแทนกำเนิด: มุมมองเบื้องต้น" Xiachong Feng (Hit) และคณะ arxiv. [กระดาษ]
- [เม.ย. 2023] "การแชทหลายพรรค: ตัวแทนการสนทนาในการตั้งค่ากลุ่มกับมนุษย์และโมเดล" Jimmy Wei (Cornell & Meta) และคณะ arxiv. [กระดาษ] [ชุดข้อมูล] [รหัส]
- [เม.ย. 2023] "ตัวแทนกำเนิด: simulacra แบบโต้ตอบของพฤติกรรมมนุษย์" จุนซองพาร์ค (สแตนฟอร์ด) และคณะ arxiv. [กระดาษ] [รหัส]
การมีปฏิสัมพันธ์กับมนุษย์-ตัวแทน
- [ต.ค. 2023] "วิธีการประมวลผล AI ล่าช้าในการส่งเสริมความคิดสร้างสรรค์: การสำรวจคำถามการวิจัยร่วมสร้างกับตัวแทนที่ใช้ LLM" Yiren Liu (UIUC) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "การหาปริมาณผลกระทบของแบบจำลองภาษาขนาดใหญ่ที่มีต่อการเปลี่ยนแปลงความคิดเห็นร่วมกัน" Chao Li (Zju) และคณะ arxiv. [กระดาษ]
- [ส.ค. 2023] "Sapien: ตัวแทนเสมือนจริงที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่" Masum Hasan (U of Rochester) และคณะ arxiv. [กระดาษ]
- [ก.ค. 2023] "การทำความเข้าใจถึงประโยชน์และความท้าทายของการใช้ตัวแทนการสนทนาแบบจำลองภาษาขนาดใหญ่สำหรับการสนับสนุนความเป็นอยู่ที่ดีทางจิต" Zilin MA (Harvard) และคณะ arxiv. [กระดาษ]
LLM ที่ขับเคลื่อนด้วยตัวแทน
- [ต.ค. 2023] "เอเจนต์สั่งให้แบบจำลองภาษาขนาดใหญ่เป็นเหตุผลที่ไม่เป็นศูนย์ทั่วไป" Nicholas Crispino (Washu) และคณะ arxiv. [กระดาษ] [รหัส]
- [ต.ค. 2023] "ß-coder: การเรียนรู้การเสริมแรงลึกตามมูลค่าสำหรับการสังเคราะห์โปรแกรม" Zishun Yu (UIC & Bytedance) และคณะ arxiv. [กระดาษ]
- [พฤษภาคม 2023] "การฝึกอบรมแบบจำลองภาษาที่จัดเรียงทางสังคมในสังคมมนุษย์จำลอง" Ruibo Liu (Dartmouth) และคณะ arxiv. [กระดาษ] [รหัส]
- [พฤษภาคม 2023] "แบบจำลองภาษาพบกับแบบจำลองโลก: ประสบการณ์ที่เป็นตัวเป็นตนช่วยเพิ่มโมเดลภาษา" Jiannan Xiang (UCSD) และคณะ Neurips 2023. [กระดาษ] [รหัส]
เกณฑ์มาตรฐาน
- [ก.ค. 2024] "AppWorld: โลกที่ควบคุมได้ของแอพและผู้คนสำหรับการเปรียบเทียบการเข้ารหัสการเข้ารหัสแบบโต้ตอบ" Harsh Trivedi (Stony Brook University) และคณะ ACL 2024. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ธ.ค. 2023] "T-Eval: การประเมินความสามารถในการใช้เครื่องมือของแบบจำลองภาษาขนาดใหญ่ทีละขั้นตอน" Zehui Chen (USTC, Shanghai AI Lab) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [พ.ย. 2023] "เวทมนตร์: การตรวจสอบรูปแบบภาษาขนาดใหญ่ขับเคลื่อนหลายตัวแทนในการรับรู้การปรับตัวความมีเหตุผลและการทำงานร่วมกัน" * Lin Xu et al. (NUS, Bytedance, Stanford & UC Berkeley) * arxiv [กระดาษ] [หน้าโครงการ]
- [ต.ค. 2023] "การปรับสมดุลความเป็นอิสระและการจัดตำแหน่ง: อนุกรมวิธานหลายมิติสำหรับสถาปัตยกรรมหลายตัวแทนที่ใช้พลังงาน LLM แบบอิสระ" Thorsten Händler (Fernfh) และคณะ arxiv. [กระดาษ]
- [ต.ค. 2023] "การเปรียบเทียบแบบจำลองภาษาขนาดใหญ่เป็นตัวแทนวิจัย AI" Qian Huang (Stanford) และคณะ arxiv. [กระดาษ] [รหัส]
- [ต.ค. 2023] "เกณฑ์มาตรฐาน METATOOL สำหรับรุ่นภาษาขนาดใหญ่: ตัดสินใจว่าจะใช้เครื่องมือและที่จะใช้" Yue Huang (Lehigh University) และคณะ arxiv. [กระดาษ] [ชุดข้อมูล]
- [ต.ค. 2023] "สมาร์ทเพลย์: มาตรฐานสำหรับ LLMS เป็นตัวแทนอัจฉริยะ" Yue Wu (CMU & Microsoft) และคณะ arxiv. [กระดาษ] [รหัส]
- [ก.ย. 2023] "การระบุความเสี่ยงของตัวแทน LM ด้วย Sandbox ที่ได้รับการยกย่อง LM" Yangjun Ruan (University of Toronto & Vector Institute) และคณะ arxiv. [กระดาษ] [รหัส] [ตัวอย่าง] [หน้าโครงการ]
- [ส.ค. 2023] "Bolaa: การเปรียบเทียบและการจัดเตรียมตัวแทนอิสระ LLM-Augmented" Zhiwei Liu (Salesforce) และคณะ arxiv. [กระดาษ] [รหัส]
- [ส.ค. 2023] "Agentbench: การประเมิน LLMS เป็นตัวแทน" Xiao Liu (Thu) และคณะ arxiv. [กระดาษ] [รหัส] [หน้าโครงการ]
- [ส.ค. 2023] "TPTU: การวางแผนงานและการใช้เครื่องมือของตัวแทน AI แบบจำลองภาษาขนาดใหญ่" Jingqing Ruan (Sensetime) และคณะ arxiv. [กระดาษ]
- [มิถุนายน 2023] "ToolQa: ชุดข้อมูลสำหรับคำถาม LLM ตอบคำถามภายนอก" Yuchen Zhuang (Gatech) และคณะ Neurips 2023. [กระดาษ] [รหัส]
การสำรวจและการสอน
- [ก.ย. 2023] "การสร้างแบบจำลองบริบทตามธรรมชาติและการให้เหตุผลกับ LLMS: บทช่วยสอน" Haoyi Xiong (Baidu) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "การสำรวจเชิงลึกของตัวแทนปัญญาประดิษฐ์แบบจำลองภาษาขนาดใหญ่" Pengyu Zhao (BJTU) และคณะ arxiv. [กระดาษ]
- [ก.ย. 2023] "การเพิ่มขึ้นและศักยภาพของตัวแทนแบบจำลองภาษาขนาดใหญ่: การสำรวจ" Zhiheng XI (FDU) และคณะ arxiv. [กระดาษ] [GitHub]
- [ส.ค. 2023] "การสำรวจเกี่ยวกับตัวแทนอิสระที่ใช้โมเดลภาษาขนาดใหญ่" Lei Wang (RUC) และคณะ arxiv. [กระดาษ] [GitHub]
- [มี.ค. 2023] "การสำรวจแบบจำลองภาษาขนาดใหญ่ (วินาที 6.3 - การวางแผนสำหรับการแก้ปัญหาที่ซับซ้อน)" Wayne Xin Zhao (RUC) และคณะ arxiv. [กระดาษ] [GitHub]
โครงการโอเพ่นซอร์ส
โครงการแก้ปัญหาอิสระ
- Auto-GPT-ความพยายามโอเพนซอร์สทดลองเพื่อให้ GPT-4 เป็นอิสระอย่างเต็มที่
- ?? Langchain - การสร้างแอปพลิเคชันที่มี LLM ผ่านการรวมกัน
- GPT Engineer - ระบุสิ่งที่คุณต้องการให้สร้าง AI ขอให้คำชี้แจงและสร้างมันขึ้นมา
- metagpt -? เฟรมเวิร์ก Multi-Agent: ให้หนึ่งเส้นข้อกำหนดหนึ่งบรรทัด, ส่งคืน PRD, การออกแบบ, งาน, repo
- Babyagi - ระบบการจัดการงานที่ขับเคลื่อนด้วย AI
- L2MAC - กรอบคอมพิวเตอร์อัตโนมัติ LLM: L2MAC
- Yacana - ?? เปิดเครื่องเปิดแหล่งข้อมูลด้วยการแชทหลายตัวแทนและเวิร์กโฟลว์การสร้าง
โครงการจำลองหลายตัวแทน
- AI Town ?? - ชุดเริ่มต้นที่สามารถปรับใช้งานได้สำหรับการสร้างและปรับแต่ง AI Town เวอร์ชันของคุณเอง - เมืองเสมือนจริงที่ตัวละคร AI อาศัยอยู่แชทและเข้าสังคม
- GPTEAM-การจำลองแบบหลายตัวแทนโอเพนซอร์ซ
- - Chatarena - สภาพแวดล้อมเกมภาษาหลายตัวแทนสำหรับ LLMS
- - Agentverse? - เฟรมเวิร์กที่ยืดหยุ่นที่ทำให้กระบวนการสร้างสภาพแวดล้อมแบบหลายตัวแทนแบบกำหนดเองง่ายขึ้นสำหรับแบบจำลองภาษาขนาดใหญ่ (LLMS)
มุมมอง
- ตัวแทนภาษา: ขั้นตอนการวิวัฒนาการที่สำคัญของปัญญาประดิษฐ์ - Yu Su (OSU), 5 ก.ย. 2023
- Introducing XLang: An Open-Source Framework for Building Language Model Agents via Executable Language Grounding - XLANG Lab, Aug 9, 2023.
- What are GPT Agents? A deep dive into the AI interface of the future - Learn why Agents are a core part of the future of AI, Logan Kilpatrick (OpenAI), Jul 25, 2023.
- Language Agents in the Digital World: Opportunities and Risks - Shunyu Yao (Princeton) et al., Jul 24, 2023.
- KokoMind: Can LLMs Understand Social Interactions? - Imagine an AI ? at a cocktail party ?, Weiyan Shi (Columbia) et al., Jul, 2023
- LLM Powered Autonomous Agents - Amazing blog by Lilian Weng (OpenAI), Jun 23, 2023.
Other Related Sources
- Personalized Generative AI @ CIKM'23
- LLM-Agents-Papers - A repo lists papers about LLM role playing, memory mechanism and LLM game playing.
- LLMAgentPapers - Must-read papers on multiagents of LLMs.
- awesome-llm-agents - A curated list of awesome LLM agents.
Acknowledgement
We greatly appreciate any contributions via PRs, issues, emails, or other methods. Thanks Tianle Cai (@ctlllll), Yifan Song (@Yifan-Song793), Xinya Du (@xinyadu), Binfeng Xu (@billxbf), Xuanhe Zhou (@zhouxh19), Boyuan Zheng (@boyuanzheng010), Qiao Jin (@Andy-jqa), Shenao Zhang (@shenao-zhang), Yu Gu (@entslscheia), Zhibin Gou (@ZubinGou), Fan Zhou (@koalazf99), Ziniu Hu (@acbull), Yangjun Ruan (@ryoungj), Zhiyuan Hu (@zhiyuanhubj), Qinlin Zhao (@icecream-and-tea), Lucio La Cava (@luciolcv), Zehui Chen (@zehuichen123), Rishi Hazra (@RishiHazra), Lin Guan (@GuanSuns), Yuchen Zhuang (@night-chen), Xuhui Zhou (@XuhuiZhou), Samuel Holt (@samholt) and many others for their kind suggestions and contributions.
The repository is initially built and maintained by Yupeng Hou ([email protected]).