دراسة استقصائية عن وكلاء لعب اللعبة والنماذج الكبيرة: الأساليب والتطبيقات والتحديات
؟ قريباً : أضف مقدمة واحدة إلى كل ورقة.
؟ أخبار
[2024/02/06] إنشاء هذا المستودع للحفاظ على قائمة الأوراق على الوكلاء المستندة إلى LLM للعب اللعبة. المزيد من الأوراق قريبا!
2024/08
- [2024/08/07] Optimus-1: تمكين الذاكرة متعددة الوسائط الهجينة العوامل التي تمكن من التفوق في مهام الطويلة. [ورقة] [رمز]
2024/07
- [2024/07/21] VideOgameBunny: نحو مساعدي الرؤية لألعاب الفيديو. [ورقة] [رمز]
- [2024/07/05] AutoVerse: لغة لعبة قابلة للترحيل لتعلم الوكلاء القويين المجسدين. [ورق]
- [2024/07/02] المهد: تمكين وكلاء الأساس نحو التحكم العام في الكمبيوتر. [ورقة] [المشروع]
2024/06
- [2024/06/20] اثنان من الزرافات في حقل الأوساخ: استخدام لعب اللعبة للتحقيق في نمذجة الموقف في نماذج كبيرة متعددة الوسائط. [ورق]
2024/05
- [2024/05/23] نحو تأريض LLM فعال للتعاون متعدد الوكلاء المجسد. [ورقة] [المشروع]
- [2024/05/11] اللاعب السريع: دراسة تجريبية عن وكيل LLM-Evaluating في لعبة طاقة ذات معنى. [ورق]
2024/04
- [2024/04/17] AgentKit: هندسة التدفق مع الرسوم البيانية ، وليس الترميز. [ورقة] [رمز]
- [2024/04/16] تعزز لعبة اللغات اللغوية ذاتية التشغيل الذاتي المنطق LLM. [ورقة] [رمز]
2024/03
- [2024/03/23] تقييم LLMs في الوقت الفعلي مع Street Fighter III. [شفرة]
- [2024/03/19] يتعلم عوامل LLM تجسد التعاون في الفرق المنظمة. [ورق]
- [2024/03/18] هل يمكن أن تتعاون العوامل المستقلة ذات الحكم الذاتي LLM؟ [ورق]
- [2024/03/18] Envgen: توليد وتكييف البيئات عبر LLMS للتدريب العوامل المجسدة. [ورق]
- [2024/03/18] MINEDReamer: تعلم اتباع التعليمات عبر سلسلة من الخيال للتحكم في العالم المحاكاة. [ورقة] [رمز]
- [2024/03/14] توسيع نطاق العوامل التعليمية عبر العديد من العوالم المحاكاة. [ورق]
- [2024/03/13] نظام التنظيم التلقائي الهرمي للتنقل متعدد الوكلاء المفتوح. [ورق]
- [2024/03/13] Sotopia-$ PI $: التعلم التفاعلي لوكلاء اللغة الذكية اجتماعيًا. [ورقة] [رمز]
- [2024/03/08] هل سيقوم GPT-4 Run Doom؟ [ورقة] [رمز]
- [2024/03/05] نحو التحكم العام في الكمبيوتر: وكيل متعدد الوسائط لصالح Red Dead Redemption II كدراسة حالة. [ورقة] [المشروع]
- [2024/03/01] لعب Nethack مع LLMS: المحتملة والقيود كوكلاء صفري. [ورقة] [رمز]
2024/02
- [2024/02/29] RL-GPT: دمج التعلم التعزيز والرمز-السياسة. [ورق]
- [2024/02/27] Agent-Pro: تعلم التطور عبر انعكاس على مستوى السياسة والتحسين. [ورقة] [رمز]
- [2024/02/21] PCA-Bench: تقييم نماذج اللغة الكبيرة متعددة الوسائط في سلسلة عمل الإدراك. [ورقة] [رمز]
- [2024/02/20] ماذا لو كان لدى LLMs وجهات نظر عالمية مختلفة: محاكاة الحضارات الغريبة مع الوكلاء القائم على LLM. [ورقة] [رمز]
- [2024/02/07] S-Agents: عوامل التنظيم الذاتي في البيئات المفتوحة. [ورق]
- [2024/02/04] يعزز التفكير في نماذج اللغة الكبيرة في ذئب اللعبة. [ورق]
- [2024/02/02] Pokéllmon: عميل من الإنسان للمعارك بوكيمون مع نماذج لغة كبيرة. [ورقة] [رمز]
2024/01
- [2024/01/31] Swarmbrain: وكيل مجسّد للعبة الإستراتيجية في الوقت الفعلي StarCraft II عبر نماذج لغة كبيرة. [ورق]
- [2024/01/19] CIVEREALM: أوديسي التعلم والمنطق في الحضارة لوكلاء صنع القرار. [ورقة] [رمز]
- [2024/01/17] البحث عن مثيلات الأخطاء في مستودعات فيديو اللعب. [ورقة] [بيانات]
- [2024/01/04] Pokergpt: حلال خفيف الوزن من طرف إلى طرف لاعب متعدد اللاعبين Texas Hold'em عبر نموذج لغة كبير. [ورق]
2023/12
- [2023/12/29] التعاون أثناء الطيران: استكشاف وكلاء اللغة للعمل الجماعي المخصص في لعبة أفالون. [ورق]
- [2023/12/23] وكيل لغة هرمي مدعوم من LLM للتنسيق في الوقت الفعلي. [ورقة] [المشروع]
- [2023/12/19] تلعب نماذج اللغة الكبيرة StarCraft II: المعايير وسلسلة من نهج التلخيص. [ورق]
- [2023/12/14] Auto MC-Reward: تصميم مكافآت كثيف تلقائي مع نماذج لغة كبيرة لميني كرافت. [ورق]
- [2023/12/12] MP5: نظام تجسيد متعدد الوسائط في Minecraft عبر الإدراك النشط. [ورقة] [رمز]
- [2023/12/08] Oracle Apollo's Oracle: التفكير المنطقي في الاسترجاع في المناقشات متعددة الوكلاء. [ورقة] [رمز]
- [2023/12/08] Glitchbench: هل يمكن للموديلات المتعددة الوسائط الكشف عن مواطن الخلل في ألعاب الفيديو؟ [ورقة] [رمز]
- [2023/12/07] إطار عمل لاستكشاف تصورات اللاعب للحوار الذي تم إنشاؤه في LLM في ألعاب الفيديو التجارية. [ورقة] [موقع]
- [2023/12/05] الوكلاء الإبداعيين: تمكين الوكلاء مع الخيال للمهام الإبداعية. [ورقة] [رمز]
- [2023/12/04] المشفرات البصرية لتعلم تقليد البيانات الفعالة في ألعاب الفيديو الحديثة. [ورق]
- [2023/12/02] بناء وكيل مجسد مفتوح من خلال التكيف ثنائي الاتجاه اللغوي. [ورق]
- [2023/12/01] فك تشفير المحققين الرقميين: فهم سلوكيات LLM وقدراتها في ألعاب الغموض متعددة الوكلاء. [ورق]
2023/11
- [2023/11/28] الحرب والسلام (Waragent): محاكاة كبيرة متعددة الوكلاء القائمة على نموذج اللغة. [ورقة] [رمز]
- [2023/11/26] انظر وفكر: وكيل مجسد في البيئة الافتراضية. [ورقة] [رمز]
- [2023/11/20] DesignGPT: تعاون متعدد الوكلاء في التصميم. [ورق]
- [2023/11/14] السحر: التحقيق في نموذج اللغة الكبير يعمل متعددة في الإدراك ، والقدرة على التكيف ، والعقلانية والتعاون. [ورقة] [رمز]
- [2023/11/10] Jarvis-1: عوامل متعددة المهام المفتوحة مع نماذج لغة متعددة الوسائط ذات الذاكرة. [ورقة] [رمز]
- [2023/11/08] التكيف: التحلل والتخطيط الذي يرجع إلى ذلك مع نماذج اللغة. [ورقة] [رمز]
2023/10
- [2023/10/31] الاستفادة من ألعاب تخمين الكلمات لتقييم ذكاء نماذج اللغة الكبيرة. [ورقة] [رمز]
- [2023/10/29] وكلاء اللغة مع التعلم التعزيز للعب الاستراتيجي في لعبة الذئب. [ورق]
- [2023/10/23] التحقيق في جمعية الوكيل المستندة إلى LLM: التعاون والمواجهة في لعبة Avalon Gameplay. [ورق]
- [2023/10/20] Steve-eye: تجسيد عوامل تجسد قائمة على LLM مع الإدراك البصري في العوالم المفتوحة. [ورقة] [رمز]
- [2023/10/18] Sotopia: تقييم تفاعلي للذكاء الاجتماعي في وكلاء اللغة. [ورقة] [رمز]
- [2023/10/16] حرف-ملم: وكيل قابل للتدريب للعب الأدوار. [ورقة] [رمز]
- [2023/10/13] Llama Rider: تحفيز نماذج لغة كبيرة لاستكشاف العالم المفتوح. [ورق]
- [2023/10/12] GameGPT: إطار تعاوني متعدد الوكلاء لتطوير اللعبة. [ورق]
- [2023/10/12] Groot: تعلم اتباع التعليمات من خلال مشاهدة مقاطع فيديو اللعب. [ورقة] [رمز]
- [2023/10/12] الأخطبوط: تجسيد مبرمج لغة الرؤية من ردود الفعل البيئية. [ورقة] [رمز]
- [2023/10/10] Metaagents: محاكاة التفاعلات بين السلوكيات البشرية للتنسيق الموجه نحو المهمة LLM عبر عوامل توليدية تعاونية. [ورق]
- [2023/10/09] عوامل الإنسان: منصة لمحاكاة العوامل التوليدية التي تشبه الإنسان. [ورقة] [رمز]
- [2023/10/08] Avalonbench: تقييم LLMs لعب لعبة Avalon. [ورقة] [رمز]
- [2023/10/06] الفضول الحذر: نهج جديد لعامل اللعب الذي يشبه الإنسان. [ورقة] [رمز]
- [2023/10/05] LLM-COOCITINALINATE: تقييم وتحليل قدرات التنسيق متعدد الوكلاء في نماذج اللغة الكبيرة. [ورقة] [رمز]
- [2023/10/03] عوامل Lyfe: عوامل توليدية للتفاعلات الاجتماعية في الوقت الفعلي منخفضة التكلفة. [ورق]
- [2023/10/03] نحو اتخاذ القرارات المتجسدة من طرف إلى نهاية من خلال نموذج لغة كبير متعدد الوسائط: استكشافات مع GPT4-Vision وخارجها. [ورقة] [رمز]
- [2023/10/02] SmartPlay: معيار لـ LLMS كعوامل ذكية. [ورقة] [رمز]
- [2023/10/02] لعبة أفكار أفالون: معركة ضد الخداع من خلال التأمل المتكرر. [ورق]
- [2023/10/01] Rolellm: القياس ، والاستنباط ، وتعزيز قدرات لعب الأدوار لنماذج اللغة الكبيرة. [ورقة] [رمز]
2023/09
- [2023/09/29] Adarefiner: تحسين قرارات نماذج اللغة مع ردود الفعل التكيفية. [ورقة] [رمز]
- [2023/09/29] الحافز: الدافع الجوهري من ردود الفعل الذكاء الاصطناعي. [ورقة] [رمز]
- [2023/09/29] LLM-Deliberation: تقييم LLMS مع ألعاب التفاوض التفاعلية متعددة الوكلاء. [ورقة] [رمز]
- [2023/09/29] الشكوك-العامل: لعب ألعاب المعلومات غير الكاملة مع نظرية العقل GPT-4. [ورقة] [رمز]
- [2023/09/29] Autoagents: إطار لتوليد الوكيل التلقائي. [ورقة] [رمز]
- [2023/09/21] تأتي المعرفة الحقيقية من الممارسة: محاذاة نماذج اللغة الكبيرة مع بيئات مجسدة عبر تعلم التعزيز. [ورقة] [رمز]
- [2023/09/18] Mindagent: تفاعل الألعاب الناشئة. [ورقة] [رمز]
- [2023/09/14] الوكلاء: إطار عمل مفتوح المصدر لوكلاء اللغة المستقلة. [ورقة] [رمز]
- [2023/09/09] استكشاف نماذج اللغة الكبيرة لألعاب الاتصالات: دراسة تجريبية على الذئب. [ورق]
2023/08
- [2023/08/23] هل لاعبو ChatGPT و GPT-4 Good Poker؟-تحليل ما قبل التقلب. [ورق]
- [2023/08/22] Proagent: بناء AI التعاونية الاستباقية باستخدام نماذج لغة كبيرة. [ورقة] [رمز]
- [2023/08/21] Agentverse: تسهيل التعاون متعدد الوكلاء واستكشاف السلوكيات الناشئة في الوكلاء. [ورقة] [رمز]
- [2023/08/19] GameEval: تقييم LLMs على ألعاب المحادثة. [ورقة] [رمز]
- [2023/08/16] Autogen: تمكين تطبيقات LLM من الجيل التالي عبر إطار محادثة متعدد الوكلاء. [ورق]
- [2023/08/15] Calypso: LLMS كمساعدين Master في الزنزانة. [ورق]
- [2023/08/08] agentsims: صندوق رمل مفتوح المصدر لتقييم نموذج اللغة الكبير. [ورق]
- [2023/08/01] Metagpt: برمجة META لإطار تعاوني متعدد الوكلاء. [ورقة] [رمز]
2023/07
- [2023/07/24] Tachikuma: فهم التفاعلات المعقدة مع الكائنات المتعددة والرواية من خلال نماذج لغة كبيرة. [ورق]
- [2023/07/21] تصور انتقائي: تحسين أوصاف الحالة مع التعلم التعزيز للجهات الفاعلة النموذجية اللغوية. [ورقة] [المشروع]
- [2023/07/12] Sayplan: تأريض نماذج لغة كبيرة باستخدام الرسوم البيانية للمشهد ثلاثي الأبعاد لتخطيط المهام القابلة للتطوير. [ورق]
- [2023/07/05] بناء العوامل التعاونية المجسدة بشكل معياري مع نماذج لغة كبيرة. [ورقة] [رمز]
- [2023/07/04] تابا: تجسيد تخطيط المهام مع نماذج لغة كبيرة. [ورقة] [رمز]
2023/06
- [2023/06/20] العدو: السياسة القابلة للتطوير قبل التدريب عبر تعليمات اللغة. [ورقة] [رمز]
- [2023/06/15] Chessgpt: سد السياسة التعلم ونمذجة اللغة. [ورقة] [رمز]
- [2023/06/02] Omni: الانفتاح عبر نماذج من المفاهيم الإنسانية من الاهتمام. [ورقة] [رمز]
- [2023/06/01] Steve-1: نموذج توليدي للنص من أجل السلوك في Minecraft. [ورقة] [رمز]
2023/05
- [23 مايو] كوخ: توليد ألعاب المغامرة النصية المتماسكة. [ورقة] [رمز]
- [2023/05/30] Alphablock: تجسيد التكافؤ من أجل التفكير اللغوي في المعالجة الروبوت. [ورق]
- [2023/05/26] لعب ألعاب متكررة مع نماذج لغة كبيرة. [ورق]
- [2023/05/25] Voyager: عامل مجسد مفتوح مع نماذج لغة كبيرة. [ورقة] [رمز]
- [2023/05/25] Ghost in the Minecraft: عوامل قادرة بشكل عام على بيئات العالم المفتوح عبر نماذج لغة كبيرة مع المعرفة والذاكرة القائمة على النص. [ورقة] [رمز]
- [2023/05/24] الربيع: دراسة الأوراق والمنطق للعب الألعاب. [ورقة] [رمز]
- [2023/05/23] تحسين الواقعية والمنطق في نماذج اللغة من خلال النقاش المتعدد. [ورقة] [رمز]
- [2023/05/17] تحسين التفاوض على نموذج اللغة مع اللعب الذاتي والتعلم داخل السياق من ردود الفعل من الذكاء الاصطناعي. [ورقة] [رمز]
- [2023/05/09] TIDYBOT: مساعدة الروبوت الشخصية مع نماذج اللغة الكبيرة. [ورقة] [رمز]
- [2023/05/01] ARK: الواقع المعزز مع القدرة التفاعلية التفاعلية الناشئة. [ورق]
2023/04
- [2023/04/07] عوامل توليمية: Simulacra التفاعلية للسلوك البشري. [ورقة] [رمز]
- [2023/04/06] هل يمكن أن تلعب نماذج اللغة الكبيرة ألعابًا نصية بشكل جيد؟ أسئلة حديثة من الحديث والمفتوح. [ورقة] [رمز]
- [APR-23] مخصصة لتوليد السعي والحوار في ألعاب لعب الأدوار: نهج قائم على نموذج الرسم البياني واللغة. [ورقة] [رمز]
2023/03
- [2023/03/31] الإبل: وكلاء التواصل من أجل "العقل" استكشاف مجتمع اللغة الكبير. [ورقة] [رمز]
- [2023/03/29] التعلم التعزيز للمهارات والتخطيط لمهام الهوريزون الطويلة المفتوحة. [ورقة] [رمز]
- [2023/03/06] Palm-E: نموذج لغة متعددة الوسائط مجسدة. [ورق]
2023/02
- [2023/02/13] توجيه ما قبل التدريب في التعلم التعزيز مع نماذج اللغة الكبيرة. [ورقة] [رمز]
- [2023/02/12] Mariogpt: توليد مستشفى مفتوح من خلال نماذج اللغة الكبيرة. [ورقة] [رمز]
- [2023/02/03] وصف وشرح وخطة واختيار: التخطيط التفاعلي مع LLMS يتيح وكلاء المهام متعددة المهام المفتوحة. [ورقة] [رمز]
2023/01
- [2023/01/28] لا تجسد العوامل التي تجسد من الأغنام المخصصة: تجسيد اتخاذ القرارات باستخدام نمذجة العالم الموجهة اللغة. [ورق]
- [2023/01/21] التحكم في المهام المتعددة المفتوحة من خلال التعلم التمثيلي المدرك في الأهداف والتنبؤ الأفق التكيفي. [ورقة] [رمز]
2022
- [2022/11/22] مسرحية على مستوى الإنسان في لعبة الدبلوماسية من خلال الجمع بين نماذج اللغة والتفكير الاستراتيجي. [ورق]
- [2022/11/21] اكتساب المهارات الآلية عبر زيادة التعليمات مع نماذج اللغات الرؤية. [ورق]
- [2022/10/24] تمثيلات العالم الناشئة: استكشاف نموذج تسلسل مدرب على مهمة اصطناعية. [ورقة] [رمز]
- [2022/10/05] نماذج اللغة الكبيرة هي أجهزة الكشف عن أخطاء ألعاب الفيديو جيدة جدًا. [ورقة] [رمز]
- [2022/08/08] Simulacra الاجتماعية: إنشاء نماذج أولية مأهولة لأنظمة الحوسبة الاجتماعية. [ورق]
- [2022/07/12] المونولوج الداخلي: تجسيد التفكير من خلال التخطيط مع نماذج اللغة. [ورق]
- [2022/06/23] مقطع فيديو بريتيور (VPT): تعلم العمل من خلال مشاهدة مقاطع الفيديو غير المخصصة على الإنترنت. [ورق]
- [2022/06/07] Minedojo: بناء وكلاء مجسدين مفتوحين مع معرفة على نطاق الإنترنت. [ورقة] [رمز]
اقتباس
إذا وجدت هذا المستودع مفيدًا ، فيرجى الاستشهاد بالورقة:
@misc{xu2024survey,
title={A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges},
author={Xinrun Xu, Yuxin Wang, Chaoyi Xu, Ziluo Ding, Jiechuan Jiang, Zhiming Ding, Börje F. Karlsson},
year={2024},
eprint={2403.10249},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
اتصال