中文|英語
真實代理是一個計劃框架,將傳統人工智能方法與大語言模型(LLM)相結合,適用於生成的AI代理。它包括一個Unity插件和演示項目。
該項目開發的原因是要完成我的本科論文(設計)和我對遊戲AI的個人興趣。

大型語言模型可以執行推理,決策和計劃問題。我們已經有許多成熟的代理框架來幫助用戶操作一些工具,例如搜索文檔和創建網頁。
但是我認為在遊戲中實施它時有幾個問題:
難以調試:如果行為執行依賴於LLM,它將帶來難以估計的令牌用法以及如何處理代理異常;
緩慢的響應:例如,如果遊戲中的狀態發生變化,我們可能需要重建提示單詞和上下文。如果讓NPC像生成AI一樣生成計劃,則需要大量時間等待LLM生成,而LLM不能應用於實時遊戲。
因此,我試圖根據傳統的AI方法製作LLM,允許代理通過了解狀態數量和行為之間的關係來計劃,而行為執行和狀態監控由程序完成,並且代理只會在狀態更改時觸發計劃行動。 。
{
"dependencies" : {
"com.cysharp.unitask" : " https://github.com/Cysharp/UniTask.git?path=src/UniTask/Assets/Plugins/UniTask " ,
"com.huggingface.sharp-transformers" : " https://github.com/AkiKurisu/sharp-transformers.git " ,
"com.kurisu.akiai" : " https://github.com/AkiKurisu/AkiAI.git " ,
"com.kurisu.akibt" : " https://github.com/AkiKurisu/AkiBT.git " ,
"com.kurisu.akiframework" : " https://github.com/AkiKurisu/AkiFramework.git " ,
"com.kurisu.akigoap" : " https://github.com/AkiKurisu/AkiGOAP.git " ,
"com.kurisu.unichat" : " https://github.com/AkiKurisu/UniChat.git "
}
}從發布頁面下載Windows Build版本
首先使用LLM根據GOAP數據標記操作和目標。
讓代理商和規劃師在運行時基於世界各州(世界州)生成和搜索計劃。
比較計劃,LLM在內存上反映和迭代。
然後,您可以關閉計劃者並讓代理生成計劃。

首先,開發人員定義了可執行的ActionSet集( Actions )和目標集( GoalSet )。

每個行為都是基於GOAP規則的,並且具有前提Precondition和Effect 。
public class Eat : DescriptiveTask
{
protected sealed override void SetupDerived ( )
{
Preconditions [ States . HasFood ] = true ;
Preconditions [ States . IsHungry ] = true ;
}
protected sealed override void SetupEffects ( )
{
Effects [ States . IsHungry ] = false ;
}
}其次,將Action輸入大型語言模型,將其匯總為自然語言,作為代理人對行為( InitialImpression )和長期記憶( Summary )的初始印象,並留下短期記憶( Comments )空白。
"Name" : " Cook " ,
"InitialImpression" : " To Cook, you need to have energy and ingredients, and as a result, you will have food. " ,
"Summary" : " Latest summary " ,
"Comments" : [
" " ,
" " ,
" " ,
" " ,
" "
]輸入大型語言模型的Goal ,讓LLM生成自然語言作為使用該目標的解釋( Explanation )。並結合它們以獲得集合G的解釋。
在實際代理中,您可以直接單擊RealAgentSet編輯器中的Self Description以生成上述數據。

調整代理模式( AgentMode )並將其設置為Training 。
計劃者此時運行的Plan由計劃者搜索,並且代理商同時生成Plan 。如果行為有差異,LLM會反思原因並將Comment作為短期內存。
當短期內存達到閾值時,代理會根據初始印象,評論和當前的長期記憶來匯總它,覆蓋長期記憶並迭代。
根據外部的目標輸入,代理在虛擬空間中實時原因。

LLM根據其自身對每種行為的記憶找到合適的Plan 。由於沒有計劃者比較,因此僅確定Plan是否可行。如果不是,LLM會生成( Comment )並將其註入內存。


該實驗使用OpenAI的ChatGpt3.5作為推理模型。您需要在遊戲設置接口中填寫自己的API鍵。
麻省理工學院
有關VRM模型,請參閱單個作者的許可證聲明。
多邊形幻想王國是一項付費資產。
https://assetstore.unity.com/packages/3d/environments/fantasy/polygon-fantasy-kingdom-kingdom-low-poly-poly-poly-3d-art-art-synty-164532
示例場景是由程序世界創建的場景優化器優化的。
可以在AssetStore中免費下載低點環境。
https://assetstore.unity.com/packages/3d/environments/lowpoly-envorirnment-nature-nature-free-medieval-fantasy-series-187052
熱量 - 完整的現代UI是付費資產。
https://assetstore.unity.com/packages/2d/gui/heat-complete-modern-ui-264857
Gui-CasualFantasy是付費資產。
https://assetstore.unity.com/packages/2d/gui/gui/gui-casual-fantasy-265651
Unity Chan Animation歸Japan Unity Technology日本所有,並符合UC2許可。
中世紀動畫巨型包有付費資產。
https://assetstore.unity.com/packages/3d/animations/medieval-animation-mega-pack-12141
Unity入門資產屬於Unity Companion許可證,可以在AssetStore中免費下載。
https://assetstore.unity.com/packages/essentials/starter-assets-thirdperson-upders--in-new-charactercontroller-pa-196526
UNIVRM符合MIT許可。
https://github.com/vrm-c/univrm
Akiframework在MIT許可下。
https://github.com/akikurisu/akiframework
演示中使用的其他動畫,音樂,UI和字體資源是網絡資源,不應用於商業目的。
@misc{realagents,
author = {YiFei Feng},
title = {Real Agents: An planning framework for generative artificial intelligence agents},
year = {2024},
publisher = {GitHub},
journal = {https://github.com/AkiKurisu/Real-Agents},
school = {East China University of Political Science and Law},
location = {Shanghai, China}
}
史蒂夫·拉賓(Steve Rabin), AI Pro 3:收集了遊戲AI專業人士的智慧,國際標準書。
[Orkin 06] Orkin,J。2006。3個州和一個計劃:恐懼的AI ,遊戲開發人員會議,加利福尼亞州舊金山。
Joon Sung Park,Joseph C. O'Brien,Carrie J. Cai,Meredith Ringel Morris,Percy Liang和Michael S. Bernstein。 2023年。生成劑:人類行為的交互式模擬。
Wang,Zihao等。 “描述,解釋,計劃和選擇:與大語言模型的互動計劃可實現開放世界的多任務代理。” ARXIV ABS/2302.01560(2023):n。 PAG。
Lin J,Zhao H,Zhang A等。代理:用於大語言模型評估的開源沙盒[J]。 ARXIV預印型ARXIV:2308.04026,2023。
XI,Z.,Chen,W.,Guo,X.,He,W.,Ding,Y.,Hong,B.,Zhang,M.,Wang,J. OU,S.,Weng,R.,Cheng,W.,Zhang,Q.,Qin,W.,Zheng,Y.,Qiu,X.,Huan,X。,&Gui,T。(2023)。大型語言模型代理的興起和潛力:調查。 ARXIV,ABS/2309.07864。