中文|英语
真实代理是一个计划框架,将传统人工智能方法与大语言模型(LLM)相结合,适用于生成的AI代理。它包括一个Unity插件和演示项目。
该项目开发的原因是要完成我的本科论文(设计)和我对游戏AI的个人兴趣。

大型语言模型可以执行推理,决策和计划问题。我们已经有许多成熟的代理框架来帮助用户操作一些工具,例如搜索文档和创建网页。
但是我认为在游戏中实施它时有几个问题:
难以调试:如果行为执行依赖于LLM,它将带来难以估计的令牌用法以及如何处理代理异常;
缓慢的响应:例如,如果游戏中的状态发生变化,我们可能需要重建提示单词和上下文。如果让NPC像生成AI一样生成计划,则需要大量时间等待LLM生成,而LLM不能应用于实时游戏。
因此,我试图根据传统的AI方法制作LLM,允许代理通过了解状态数量和行为之间的关系来计划,而行为执行和状态监控由程序完成,并且代理只会在状态更改时触发计划行动。 。
{
"dependencies" : {
"com.cysharp.unitask" : " https://github.com/Cysharp/UniTask.git?path=src/UniTask/Assets/Plugins/UniTask " ,
"com.huggingface.sharp-transformers" : " https://github.com/AkiKurisu/sharp-transformers.git " ,
"com.kurisu.akiai" : " https://github.com/AkiKurisu/AkiAI.git " ,
"com.kurisu.akibt" : " https://github.com/AkiKurisu/AkiBT.git " ,
"com.kurisu.akiframework" : " https://github.com/AkiKurisu/AkiFramework.git " ,
"com.kurisu.akigoap" : " https://github.com/AkiKurisu/AkiGOAP.git " ,
"com.kurisu.unichat" : " https://github.com/AkiKurisu/UniChat.git "
}
}从发布页面下载Windows Build版本
首先使用LLM根据GOAP数据标记操作和目标。
让代理商和规划师在运行时基于世界各州(世界州)生成和搜索计划。
比较计划,LLM在内存上反映和迭代。
然后,您可以关闭计划者并让代理生成计划。

首先,开发人员定义了可执行的操作集( ActionSet )和目标集( GoalSet )。

每个行为都是基于GOAP规则的,并且具有前提Precondition和Effect 。
public class Eat : DescriptiveTask
{
protected sealed override void SetupDerived ( )
{
Preconditions [ States . HasFood ] = true ;
Preconditions [ States . IsHungry ] = true ;
}
protected sealed override void SetupEffects ( )
{
Effects [ States . IsHungry ] = false ;
}
}其次,将Action输入大型语言模型,将其汇总为自然语言,作为代理人对行为( InitialImpression )和长期记忆( Summary )的初始印象,并留下短期记忆( Comments )空白。
"Name" : " Cook " ,
"InitialImpression" : " To Cook, you need to have energy and ingredients, and as a result, you will have food. " ,
"Summary" : " Latest summary " ,
"Comments" : [
" " ,
" " ,
" " ,
" " ,
" "
]输入大型语言模型的Goal ,让LLM生成自然语言作为使用该目标的解释( Explanation )。并结合它们以获得集合G的解释。
在实际代理中,您可以直接单击RealAgentSet编辑器中的Self Description以生成上述数据。

调整代理模式( AgentMode )并将其设置为Training 。
计划者此时运行的Plan由计划者搜索,并且代理商同时生成Plan 。如果行为有差异,LLM会反思原因并将Comment作为短期内存。
当短期内存达到阈值时,代理会根据初始印象,评论和当前的长期记忆来汇总它,覆盖长期记忆并迭代。
根据外部的目标输入,代理在虚拟空间中实时原因。

LLM根据其自身对每种行为的记忆找到合适的Plan 。由于没有计划者比较,因此仅确定Plan是否可行。如果不是,LLM会生成( Comment )并将其注入内存。


该实验使用OpenAI的ChatGpt3.5作为推理模型。您需要在游戏设置接口中填写自己的API键。
麻省理工学院
有关VRM模型,请参阅单个作者的许可证声明。
多边形幻想王国是一项付费资产。
https://assetstore.unity.com/packages/3d/environments/fantasy/polygon-fantasy-kingdom-kingdom-low-poly-poly-poly-3d-art-art-synty-164532
示例场景是由程序世界创建的场景优化器优化的。
可以在AssetStore中免费下载低点环境。
https://assetstore.unity.com/packages/3d/environments/lowpoly-envorirnment-nature-nature-free-medieval-fantasy-series-187052
热量 - 完整的现代UI是付费资产。
https://assetstore.unity.com/packages/2d/gui/heat-complete-modern-ui-264857
Gui-CasualFantasy是付费资产。
https://assetstore.unity.com/packages/2d/gui/gui/gui-casual-fantasy-265651
Unity Chan Animation归Japan Unity Technology日本所有,并符合UC2许可。
中世纪动画巨型包有付费资产。
https://assetstore.unity.com/packages/3d/animations/medieval-animation-mega-pack-12141
Unity入门资产属于Unity Companion许可证,可以在AssetStore中免费下载。
https://assetstore.unity.com/packages/essentials/starter-assets-thirdperson-upders--in-new-charactercontroller-pa-196526
UNIVRM符合MIT许可。
https://github.com/vrm-c/univrm
Akiframework在MIT许可下。
https://github.com/akikurisu/akiframework
演示中使用的其他动画,音乐,UI和字体资源是网络资源,不应用于商业目的。
@misc{realagents,
author = {YiFei Feng},
title = {Real Agents: An planning framework for generative artificial intelligence agents},
year = {2024},
publisher = {GitHub},
journal = {https://github.com/AkiKurisu/Real-Agents},
school = {East China University of Political Science and Law},
location = {Shanghai, China}
}
史蒂夫·拉宾(Steve Rabin), AI Pro 3:收集了游戏AI专业人士的智慧,国际标准书。
[Orkin 06] Orkin,J。2006。3个州和一个计划:恐惧的AI ,游戏开发人员会议,加利福尼亚州旧金山。
Joon Sung Park,Joseph C. O'Brien,Carrie J. Cai,Meredith Ringel Morris,Percy Liang和Michael S. Bernstein。 2023年。生成剂:人类行为的交互式模拟。
Wang,Zihao等。 “描述,解释,计划和选择:与大语言模型的互动计划可实现开放世界的多任务代理。” ARXIV ABS/2302.01560(2023):n。 PAG。
Lin J,Zhao H,Zhang A等。代理:用于大语言模型评估的开源沙盒[J]。 ARXIV预印型ARXIV:2308.04026,2023。
XI,Z.,Chen,W.,Guo,X.,He,W.,Ding,Y.,Hong,B.,Zhang,M.,Wang,J. Yin,Z.,Dou,S.,Weng,R.,Cheng,W.,Zhang,Q.,Qin,W.,Zheng,Y.,Qiu,X.,Huan,X。,&Gui,T。(2023)。大型语言模型代理的兴起和潜力:调查。 ARXIV,ABS/2309.07864。