中文 | إنجليزي
العوامل الحقيقية هي إطار تخطيط يجمع بين أساليب الذكاء الاصطناعي التقليدي ونماذج اللغة الكبيرة (LLM) وهي مناسبة لوكلاء الذكاء الاصطناعي. ويشمل مشروع Unity Plug-in ومشروع العرض التوضيحي.
سبب تطوير هذا المشروع هو إكمال أطروحة المرحلة الجامعية (التصميم) واهتمامتي الشخصية في لعبة AI.

يمكن أن تؤدي نماذج اللغة الكبيرة أن تؤدي مشاكل التفكير وصنع القرار ومشاكل التخطيط. لدينا بالفعل العديد من أطر عمل الوكيل الناضجة لمساعدة المستخدمين على تشغيل بعض الأدوات ، مثل البحث عن المستندات وإنشاء صفحات ويب.
لكنني أعتقد أن هناك العديد من المشكلات عند تنفيذها في اللعبة:
من الصعب تصحيح: إذا كان تنفيذ السلوك يعتمد على LLM ، فسوف يؤدي ذلك إلى الاستخدام الرمزي الذي يصعب تقديره وكيفية التعامل مع استثناءات الوكيل ؛
الاستجابة البطيئة: على سبيل المثال إذا تغيرت الحالة في اللعبة ، فقد نحتاج إلى إعادة بناء الكلمة والسياق المطري. إذا سمحت لـ NPC بإنشاء خطط كما في AI التوليدي ، فسوف يستغرق الأمر الكثير من الوقت لانتظار إنشاء LLM ، والتي لا يمكن تطبيقها على الألعاب في الوقت الفعلي.
لذلك ، حاولت إنشاء LLM بناءً على طريقة الذكاء الاصطناعى التقليدية ، مما يسمح للوكيل بالتخطيط من خلال فهم العلاقة بين كميات الدولة والسلوكيات ، في حين يتم الانتهاء من تنفيذ السلوك ومراقبة الحالة من قبل البرنامج ، وسيؤدي الوكيل إلى إجراء إجراءات تخطيط فقط عند تغيير الحالة. .
{
"dependencies" : {
"com.cysharp.unitask" : " https://github.com/Cysharp/UniTask.git?path=src/UniTask/Assets/Plugins/UniTask " ,
"com.huggingface.sharp-transformers" : " https://github.com/AkiKurisu/sharp-transformers.git " ,
"com.kurisu.akiai" : " https://github.com/AkiKurisu/AkiAI.git " ,
"com.kurisu.akibt" : " https://github.com/AkiKurisu/AkiBT.git " ,
"com.kurisu.akiframework" : " https://github.com/AkiKurisu/AkiFramework.git " ,
"com.kurisu.akigoap" : " https://github.com/AkiKurisu/AkiGOAP.git " ,
"com.kurisu.unichat" : " https://github.com/AkiKurisu/UniChat.git "
}
}قم بتنزيل إصدار Windows Build من صفحة الإصدار
استخدم أولاً LLM لتسمية الإجراء والهدف بناءً على بيانات GOAP.
اسمح للوكيل والمخطط بإنشاء خطط وبحث بناءً على دول العالم (WorldStates) أثناء وقت التشغيل.
مقارنة الخطة ، تعكس LLM ويتكرر على الذاكرة.
يمكنك بعد ذلك إغلاق المخطط والسماح للوكيل بإنشاء الخطة.

أولاً ، يحدد المطور مجموعة عمل قابلة للتنفيذ ( ActionSet ) ومجموعة الأهداف ( GoalSet ).

يعتمد كل سلوك على قواعد GOAP وله شرط مسبق Precondition Effect التأثير.
public class Eat : DescriptiveTask
{
protected sealed override void SetupDerived ( )
{
Preconditions [ States . HasFood ] = true ;
Preconditions [ States . IsHungry ] = true ;
}
protected sealed override void SetupEffects ( )
{
Effects [ States . IsHungry ] = false ;
}
} ثانياً ، Action الإدخال بنموذج اللغة الكبير ، بتلخيصه إلى لغة طبيعية باعتبارها الانطباع الأولي للوكيل عن السلوك ( InitialImpression ) والذاكرة طويلة الأجل ( Summary ) ، وترك الذاكرة القصيرة الأجل ( Comments ) فارغة.
"Name" : " Cook " ,
"InitialImpression" : " To Cook, you need to have energy and ingredients, and as a result, you will have food. " ,
"Summary" : " Latest summary " ,
"Comments" : [
" " ,
" " ,
" " ,
" " ,
" "
] Goal الإدخال لنموذج اللغة الكبير والسماح LLM بتوليد لغة طبيعية كتفسير ( Explanation ) لاستخدام الهدف. ودمجهم للحصول على تفسير المجموعة G.
في الوكلاء الحقيقيين ، يمكنك النقر مباشرة على Self Description في محرر RealAgentSet لإنشاء البيانات أعلاه.

اضبط وضع الوكيل ( AgentMode ) وقم بتعيينه على Training .
يتم البحث عن Plan التي تعمل في هذا الوقت من قبل Planner ، وينشئ الوكيل Plan في نفس الوقت. إذا كان هناك اختلاف في السلوك ، فإن LLM تنعكس على السبب ويولد Comment كذاكرة قصيرة الأجل.
عندما تصل الذاكرة على المدى القصير إلى العتبة ، يلخصها العامل بناءً على الانطباع الأولي ، والتعليقات والذاكرة الحالية على المدى الطويل ، ويكتب الذاكرة الطويلة الأجل ، ويتكرر.
بناءً على أهداف مدخلات من الخارج ، أسباب الوكيل في الوقت الفعلي في الفضاء الافتراضي.

يجد LLM Plan مناسبة بناءً على ذاكرتها الخاصة لكل سلوك. نظرًا لعدم وجود مقارنة للمخطط ، فإنه يحدد فقط ما إذا كانت Plan ممكنة. إذا لم يكن الأمر كذلك ، فإن LLM يولد ( Comment ) ويحققها في الذاكرة.


تستخدم التجربة chatgpt3.5 Openai كطراز الاستدلال. تحتاج إلى ملء مفتاح API الخاص بك في واجهة إعدادات اللعبة.
معهد ماساتشوستس للتكنولوجيا
بالنسبة لنماذج VRM ، يرجى الاطلاع على بيانات ترخيص المؤلف الفردي.
مملكة Polygon Fantasy هو أحد الأصول المدفوعة.
https://assetstore.unity.com/packages/3d/environments/fantasy/polygon-fantasy-ingdom-low-poly-3d-art-by-synty-164532
تم تحسين المشهد على سبيل المثال من خلال محسن المشهد الذي تم إنشاؤه بواسطة العوالم الإجرائية.
يمكن تنزيل بيئة LowPoly في AssetStore مجانًا.
https://assetstore.unity.com/packages/3d/environments/lowpoly-environment-nature-free-medieval-fantasy-series-187052
الحرارة - كاملة واجهة المستخدم الحديثة الأصول.
https://assetstore.unity.com/packages/2d/gui/heat-complete-modern-ui-264857
يتم دفع الأصول GUI-Casualfantasy.
https://assetstore.unity.com/packages/2d/gui/gui-casual-fantasy-265651
Unity Chan Animation مملوكة لشركة Unity Technology Japan وتحت ترخيص UC2.
الرسوم المتحركة في العصور الوسطى Mega Pack يتم دفع الأصول.
https://assetstore.unity.com/packages/3d/animations/medieval-animations-mega-pack-12141
Unity Starter Asset تحت رخصة Unity Companion ويمكن تنزيلها في AssetStore مجانًا.
https://assetstore.unity.com/packages/essentials/starter-assets-thirdperson-updates-in-new-charactercontroller-pa-196526
UNIVRM تحت رخصة معهد ماساتشوستس للتكنولوجيا.
https://github.com/vrm-c/univrm
Akiframework تحت رخصة معهد ماساتشوستس للتكنولوجيا.
https://github.com/akikurisu/akiframework
الرسوم المتحركة الأخرى والموسيقى وواجهة المستخدم والخطوط المستخدمة في العرض التوضيحي هي موارد الشبكة ويجب عدم استخدامها لأغراض تجارية.
@misc{realagents,
author = {YiFei Feng},
title = {Real Agents: An planning framework for generative artificial intelligence agents},
year = {2024},
publisher = {GitHub},
journal = {https://github.com/AkiKurisu/Real-Agents},
school = {East China University of Political Science and Law},
location = {Shanghai, China}
}
ستيف رابين ، Game AI Pro 3: Collected Wisdom of Game AI Professionals ، International Standard Book.
[Orkin 06] Orkin ، J. 2006. 3 States and A Plan: The Ai of Fear ، Comming Developers Conference ، San Francisco ، CA.
جون سونغ بارك ، جوزيف سي. أوبراين ، كاري ج. كاي ، ميريديث رينيل موريس ، بيرسي ليانغ ، ومايكل س. بيرنشتاين. 2023. العوامل التوليدية: simulacra التفاعلية للسلوك البشري.
وانغ ، زيهاو وآخرون. "صف وشرح وخطط واختيار: التخطيط التفاعلي مع نماذج اللغة الكبيرة يتيح عوامل المهمة متعددة المهام في العالم المفتوح." ARXIV ABS/2302.01560 (2023): n. باغ.
Lin J ، Zhao H ، Zhang A ، et al. agentsims: صندوق رمل مفتوح المصدر لتقييم نموذج اللغة الكبير [J]. Arxiv preprint Arxiv: 2308.04026 ، 2023.
Xi ، Z. ، Chen ، W. ، Guo ، X. ، He ، W. ، Ding ، Y. ، Hong ، B. ، Zhang ، M. ، Wang ، J. ، Jin ، S. Yin ، Z. ، Dou ، S. ، Weng ، R. ، Cheng ، W. ، Zhang ، Q. ، Qin ، W. ، Zheng ، Y. ، Qiu ، X. ، Huan ، صعود وإمكانات العوامل القائمة على نموذج اللغة الكبيرة: دراسة استقصائية. Arxiv ، ABS/2309.07864.