؟ كوالا: وكلاء لغة رائعة

مجموعة من عوامل اللغة باستخدام إطار الإطار المعرفي لعوامل اللغة (؟ coala) .
- ورقة Coala (16 صفحة من المحتوى الرئيسي): https://arxiv.org/abs/2309.02427
- تغريدة Coala (6 مواضيع): https://twitter.com/shunyuyao12/status/1699396834983362690
- ملف coala bibtex مع 300+ اقتباسات ذات صلة: coala.bib
- Coala Bibtex Citation إذا وجدت عملنا/مواردنا مفيدة:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}نظرة عامة على Coala
تحدد Coala بدقة وكيل لغة يبدأ بمساحة الحركة الخاصة به ، والتي تحتوي على جزأين:
- الإجراءات الخارجية للتفاعل مع البيئات الخارجية ( التأريض )
- الإجراءات الداخلية للتفاعل مع الذكريات الداخلية ( التفكير ، الاسترجاع ، التعلم )
- لدى وكيل اللغة ذاكرة عمل قصيرة الأجل وعدة ذكريات طويلة الأجل (اختيارية) (عرضية للتجربة ، الدلالية للمعرفة ، الإجرائية للرمز/LLM)
- التفكير = تحديث الذاكرة العاملة (مع LLM)
- استرجاع = اقرأ ذاكرة طويلة الأجل
- التعلم = اكتب ذاكرة طويلة الأجل

ثم كيف يختار وكيل اللغة الإجراء الذي يجب اتخاذه؟ يتم تنظيم أفعالها في دورات صنع القرار ، وكل دورة لها مرحلتان:
- التخطيط : يطبق الوكيل إجراءات التفكير/الاسترجاع على (تكرار) اقتراح وتقييم الإجراءات ، ثم حدد إجراء التعلم/التأريض.
- التنفيذ : يتم تنفيذ إجراء التعلم/التأريض المحدد للتأثير على الذاكرة الداخلية أو العالم الخارجي.

لفهم المزيد ، اقرأ القسم 4 من ورقتنا.
أوراق
فيما يلي مجموعة فرعية من الأوراق المكسورة من Coala.bib Plus التي تم سحبها ، مع ملصقات مساحة عمل غير صحيحة محتملة. يعتمد التاريخ على ARXIV V1. إنهم لا يمثلون جميع عمل وكيل اللغة ، ونخطط لإضافة المزيد من العمل قريبًا (ترحيب طلبات السحب) ، ولديهم ملصقات للعمل للغاية.
- (2021-10) سلاسل الذكاء الاصطناعى: تفاعل الإنسان الشفاف الذي يمكن التحكم فيه عن طريق تخصيص مطالبات نموذج لغة كبيرة (التفكير)
- (2021-10) Silg: المعيار الأساسي اللغوي الرمزي متعدد البيئة (البيئة)
- (2022-01) نماذج اللغة كمخططين صفري: استخراج المعرفة القابلة للتنفيذ للعوامل المجسدة (التأريض)
- (2022-03) PromptChainer: تسلسل نموذج اللغة الكبيرة يطالب من خلال البرمجة البصرية (التأريض)
- (2022-03) ScienceWorld: هل وكيلك أذكى من طالب الصف الخامس؟ (بيئة)
- (2022-04) افعل ما أستطيع ، وليس كما أقول: لغة التأريض في الأداء الآلي (التأريض)
- (2022-04) نماذج سقراطية: تأليف التفكير متعدد الوسائط الصفرية مع اللغة (التأريض)
- (2022-07) WebShop: نحو تفاعل الويب الحقيقي القابل للتطوير مع وكلاء اللغة المؤسسة (البيئة)
- (2022-09) progprompt: توليد خطط مهمة روبوت معروفة باستخدام نماذج لغة كبيرة (التأريض)
- (2022-10) التحلل المطالبة: نهج معياري لحل المهام المعقدة (التفكير)
- (2022-10) عين العقل: نموذج اللغة المسترقة المنطق من خلال المحاكاة (الأساس)
- (2022-10) رد فعل: تآزر التفكير والتمثيل في نماذج اللغة (التأريض ، المنطق)
- (2022-11) نماذج اللغة الكبيرة هي مهندسين موجهين على مستوى الإنسان (التفكير)
- (2022-12) LLM-Planner: تخطيط قليلة على الأرض للعوامل المجسدة مع نماذج لغة كبيرة (تأريض)
- (2022-12) لا تولد ، تمييز: اقتراح لنماذج لغة التأريض للبيئات في العالم الحقيقي (التأريض)
- (2023-02) تتوافق سلسلة من نماذج اللغة بعد فوات الأوان مع ردود الفعل (التعلم)
- (2023-02) وصف وشرح وتخطيط واختيار: التخطيط التفاعلي مع نماذج اللغة الكبيرة يتيح عوامل المهام المتعددة في العالم المفتوح (التأريض ، المنطق)
- (2023-02) Toolformer: يمكن أن تعلّم نماذج اللغة نفسها استخدام الأدوات (التأريض)
- (2023-03) نماذج الأساس لصنع القرار: المشاكل والأساليب والفرص (مسح)
- (2023-03) Hugginggpt: حل مهام الذكاء الاصطناعي مع ChatGpt وأصدقائها في وجه المعانقة (التأريض)
- (2023-03) Palm-E: نموذج لغة متعددة الوسائط مجسدة (تأريض)
- (2023-03) الانعكاس: عوامل اللغة مع التعلم اللفظي (التأريض ، المنطق ، التعلم)
- (2023-03) الإنكار الذاتي: التحسين التكراري مع التراجع الذاتي (المنطق)
- (2023-03) توليد رمز التخطيط الذاتي مع نماذج لغة كبيرة (التفكير)
- (2023-04) العوامل التوليدية: simulacra التفاعلية للسلوك البشري (التأريض ، المنطق ، الاسترجاع ، التعلم)
- (2023-04) قدرات البحث العلمي المستقل الناشئة لنماذج اللغة الكبيرة (التأريض ، المنطق)
- (2023-04) LLM+P: تمكين نماذج اللغة الكبيرة ذات الكفاءة المثلى للتخطيط (التأريض ، المنطق)
- (2023-04) مصفاة: تعليقات التفكير حول التمثيلات الوسيطة (المنطق)
- (2023-04) تدريس نماذج لغة كبيرة للدعم الذاتي (المنطق)
- (2023-04) Genegpt: زيادة نماذج اللغة الكبيرة مع أدوات المجال لتحسين الوصول إلى المعلومات الطبية الحيوية (التأريض ، المنطق)
- (2023-05) الناقد: يمكن أن تصنع نماذج اللغة الكبيرة ذاتية الأدوات مع انتقاد الأدوات (التأريض ، المنطق ، الاسترجاع)
- (2023-05) زيادة العوامل الذاتية مع نماذج لغة كبيرة (التأريض ، المنطق ، الاسترجاع ، التعلم)
- (2023-05) chatcot: سلسلة من الفكر في نماذج اللغة الكبيرة القائمة على الدردشة (التأريض ، المنطق)
- (2023-05) Toolkengpt: زيادة نماذج اللغة المجمدة مع أدوات ضخمة عبر تضمينات الأدوات (التأريض ، المنطق)
- (2023-05) يعزز التحلل المنطق عن طريق فك تشفير التقييم الذاتي (التفكير)
- (2023-05) تشجيع التفكير المتباين في نماذج اللغة الكبيرة من خلال نقاش متعدد الوكلاء (التأريض ، المنطق)
- (2023-05) تحسين الواقعية والتفكير في نماذج اللغة من خلال النقاش متعدد العوامل (التأريض ، المنطق)
- (2023-05) adaplanner: التخطيط التكيفي من ردود الفعل مع نماذج اللغة (التأريض ، الاسترجاع ، التعلم)
- (2023-05) طالبة الخطة والحل: تحسين التفكير في سلسلة الفكرة من قبل نماذج اللغة الكبيرة (التفكير)
- (2023-05) Rewoo: تفكك التفكير من الملاحظات لنماذج اللغة المعززة الفعالة (التأريض ، المنطق)
- (2023-05) swiftsage: عامل توليدي ذو تفكير سريع وبطيء للمهام التفاعلية المعقدة (التأريض ، المنطق)
- (2023-05) شجرة الأفكار: حل المشكلات المتعمدة مع نماذج اللغة الكبيرة (التفكير)
- (2023-05) Voyager: عامل مجسد مفتوح مع نماذج لغة كبيرة (التأريض ، التفكير ، الاسترجاع ، التعلم)
- (2023-06) intercode: توحيد وقياس الترميز التفاعلي مع ردود الفعل التنفيذ (التأريض ، المنطق)
- (2023-06) Toolqa: مجموعة بيانات لسؤال LLM الإجابة على الأدوات الخارجية (التأريض)
- (2023-06) MIND2WEB: نحو وكيل عام للويب (البيئة)
- (2023-06) استرداد: توصيل نماذج اللغة الكبيرة مع واجهات برمجة التطبيقات (GOOND) المريحة (التأريض ، المنطق)
- (2023-06) ToolalPaca: تعلم الأدوات المعممة لنماذج اللغة مع 3000 حالة محاكاة (التأريض ، المنطق)
- (2023-07) ويب ويب في العالم الحقيقي مع التخطيط ، وفهم السياق الطويل ، وتوليف البرنامج (التأريض ، المنطق)
- (2023-07) RT-2: نماذج حركة اللغات الرؤية تنقل معرفة الويب إلى التحكم الآلي (التأريض)
- (2023-07) روكو: تعاون جدلي متعدد الروبوت مع نماذج اللغة الكبيرة (التأريض)
- (2023-07) الروبوتات التي تطلب المساعدة: محاذاة عدم اليقين مع مخططي نموذج اللغة الكبيرة (التأريض)
- (2023-07) S $^3 $: نظام محاكاة الشبكات الاجتماعية مع وكلاء كبيرة من طراز اللغة (التأريض ، المنطق)
- (2023-07) TOLLLM: تسهيل نماذج لغة كبيرة لإتقان 16000+ واجهات برمجة التطبيقات في العالم الحقيقي (التأريض ، التفكير ، الاسترجاع)
- (2023-07) فهم فوائد وتحديات استخدام عوامل محادثة قائمة على نموذج اللغة الكبيرة لدعم الرفاه العقلي (التأريض)
- (2023-07) إطلاق التآزر المعرفي في نماذج اللغة الكبيرة: وكيل لحل المهام من خلال التورط الذاتي متعدد الشخصيات (التأريض ، المنطق)
- (2023-07) Webarena: بيئة ويب واقعية لبناء عوامل مستقلة (بيئة)
- (2023-08) AgentBench: تقييم LLMs كعوامل (بيئة)
- (2023-08) Agentverse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة في الوكلاء (البيئة)
- (2023-08) Autogen: تمكين تطبيقات LLM من الجيل التالي عبر إطار محادثة متعدد الوكلاء (التأريض ، المنطق)
- (2023-08) CGMI: إطار التفاعل العام متعدد الوكلاء (التأريض ، المنطق)
- (2023-08) Chateval: نحو مُقيِّم أفضل من LLM من خلال نقاش متعدد الوكلاء (التأريض ، المنطق)
- (2023-08) التفكير التراكمي مع نماذج اللغة الكبيرة (التفكير)
- (2023-08) طرد: عوامل LLM هي متعلمين تجريبيين (التأريض ، التفكير ، الاسترجاع ، التعلم)
- (2023-08) gpt-in-the-loop: اتخاذ القرارات التكيفية للأنظمة المتعددة (التأريض ، المنطق)
- (2023-08) Gentopia: منصة تعاونية لـ LLMS المتمحورة للأدوات (البيئة)
- (2023-08) Metagpt: برمجة التعريف للإطار التعاوني متعدد الوكل
- (2023-08) Proagent: بناء منظمة العفو الدولية الاستباقية مع نماذج لغة كبيرة (التأريض ، المنطق)
- (2023-08) Retroformer: عوامل لغة كبيرة بأثر رجعي مع تحسين التدرج السياسي (التأريض ، التفكير ، التعلم)
- (2023-08) SAPIEN: العوامل الافتراضية العاطفية مدعومة بنماذج لغة كبيرة (التأريض ، المنطق)
- (2023-08) التكامل التآزري لنماذج اللغة الكبيرة والبنية المعرفية ل AI القوية: تحليل استكشافي (التأريض ، التفكير ، الاسترجاع ، التعلم)
- (2023-09) تورا: وكيل التفكير المتكامل للأدوات لحل المشكلات الرياضية (التأريض ، التفكير ، التعلم)
- (2023-09) تحديد مخاطر عوامل LM مع صندوق رمل محصور LM (بيئة)
- (2023-09) وكيل الشك: لعب ألعاب المعلومات غير الكاملة مع نظرية العقل GPT-4 (التأريض ، المنطق)
- (2024-01) التبادل الذاتي: انعكاس أفضل من خلال منظور حل غير متناسق (التفكير ، التفكير)
- (2024-02) Agent-Pro: تعلم التطور من خلال انعكاس على مستوى السياسة وتحسينه (التفكير ، التفكير ، التعلم)
- (2024-03) LLM3: المهمة الكبيرة القائمة على نموذج اللغة وتخطيط الحركة مع تفكير فشل الحركة. (التخطيط ، المنطق)
- (2024-04) تمكين الاكتشاف الطبي الحيوي مع عوامل الذكاء الاصطناعى (عالم الذكاء الاصطناعي ، البحوث الطبية الحيوية)
- (2024-05) Timechara: تقييم الهلوسة الشخصية في الوقت المناسب لنماذج اللغة الكبيرة التي تلعب الأدوار (التفكير ، الاسترجاع)
(المزيد لإضافته قريبًا. طلب سحب الترحيب.)
موارد
- عوامل مستقلة تعمل بالطاقة (Lil'log)
- LLM-Agents-Papers
- llmagentpapers
- وكيل رائع يعمل
(المزيد لإضافته قريبًا. طلب سحب الترحيب.)