中文|英語
実際のエージェントは、従来の人工知能方法と大規模な言語モデル(LLM)を組み合わせた計画フレームワークであり、生成AIエージェントに適しています。 Unityプラグインとデモンストレーションプロジェクトが含まれています。
このプロジェクトの開発の理由は、私の学部論文(デザイン)とゲームAIに対する私の個人的な関心を完了するためです。

大規模な言語モデルは、推論、意思決定、および計画の問題を実行できます。すでに多くの成熟したエージェントフレームワークがあり、ユーザーがドキュメントの検索やWebページの作成など、いくつかのツールを操作できるようにしています。
しかし、ゲームに実装するときにいくつかの問題があると思います。
デバッグが難しい:動作の実行がLLMに依存している場合、推定が困難なトークンの使用とエージェントの例外を処理する方法をもたらします。
遅い応答:たとえば、ゲームの状態が変更された場合、迅速な単語とコンテキストを再構築する必要がある場合があります。 NPCが生成AIのようなプランを生成させた場合、LLMが生成されるのを待つのに多くの時間がかかります。これはリアルタイムゲームには適用できません。
したがって、従来のAIメソッドに基づいてLLMを作成しようとしました。エージェントは、状態の量と動作の関係を理解することで計画できるようにしましたが、動作の実行とステータス監視はプログラムによって完了し、エージェントはステータスが変更されたときにのみ計画アクションをトリガーします。 。
{
"dependencies" : {
"com.cysharp.unitask" : " https://github.com/Cysharp/UniTask.git?path=src/UniTask/Assets/Plugins/UniTask " ,
"com.huggingface.sharp-transformers" : " https://github.com/AkiKurisu/sharp-transformers.git " ,
"com.kurisu.akiai" : " https://github.com/AkiKurisu/AkiAI.git " ,
"com.kurisu.akibt" : " https://github.com/AkiKurisu/AkiBT.git " ,
"com.kurisu.akiframework" : " https://github.com/AkiKurisu/AkiFramework.git " ,
"com.kurisu.akigoap" : " https://github.com/AkiKurisu/AkiGOAP.git " ,
"com.kurisu.unichat" : " https://github.com/AkiKurisu/UniChat.git "
}
}[リリース]ページからWindowsビルドバージョンをダウンロードします
最初にLLMを使用して、GOAPデータに基づいてアクションと目標にラベルを付けます。
エージェントとプランナーは、実行時に世界状態(世界ステート)に基づいて計画を生成および検索します。
計画を比較し、LLMはメモリを反映し、反復します。
その後、プランナーを閉じて、エージェントにプランを生成させることができます。

最初に、開発者は実行可能なアクションセット( ActionSet )と目標セット( GoalSet )を定義します。

各動作はGOAPルールに基づいており、前提Preconditionと効果Effectがあります。
public class Eat : DescriptiveTask
{
protected sealed override void SetupDerived ( )
{
Preconditions [ States . HasFood ] = true ;
Preconditions [ States . IsHungry ] = true ;
}
protected sealed override void SetupEffects ( )
{
Effects [ States . IsHungry ] = false ;
}
}第二に、大規模な言語モデルへのActionを入力し、行動の最初の印象( InitialImpression )と長期記憶( Summary )として自然言語に要約し、短期記憶( Comments )を空白のままにします。
"Name" : " Cook " ,
"InitialImpression" : " To Cook, you need to have energy and ingredients, and as a result, you will have food. " ,
"Summary" : " Latest summary " ,
"Comments" : [
" " ,
" " ,
" " ,
" " ,
" "
]大規模な言語モデルにGoalを入力し、LLMが目標を使用するための説明( Explanation )として自然言語を生成できるようにします。それらを組み合わせて、セットGの解釈を取得します。
実際のエージェントでは、 RealAgentSetのエディターでSelf Descriptionを直接クリックして、上記のデータを生成できます。

エージェントモード( AgentMode )を調整し、 Trainingに設定します。
現時点で実行されているPlan Plannerによって検索され、エージェントは同時にPlanを生成します。動作に違いがある場合、LLMは理由を反映し、短期記憶としてCommentを生成します。
短期メモリがしきい値に達すると、エージェントは最初の印象、コメント、現在の長期記憶に基づいてそれを要約し、長期メモリを上書きし、反復します。
外部からの目標入力に基づいて、エージェントは仮想空間でリアルタイムで推論します。

LLMは、各動作の独自の記憶に基づいて適切なPlanを見つけます。プランナーの比較はないため、 Planが実行可能かどうかのみを決定します。そうでない場合、LLMは生成( Comment )し、メモリに注入します。


この実験では、OpenaiのChatGPT3.5を推論モデルとして使用します。ゲーム設定インターフェイスで独自のAPIキーを入力する必要があります。
mit
VRMモデルについては、個々の著者のライセンスステートメントを参照してください。
ポリゴンファンタジー王国は有料資産です。
https://assetstore.unity.com/packages/3d/environments/fantasy/polygon-fantasy-kingdom-low-3d-art-by-synty-164532
シーンの例は、手続き型の世界によって作成されたシーンオプティマイザーによって最適化されています。
LowPoly環境は、AssetStoreで無料でダウンロードできます。
https://assetstore.unity.com/packages/3d/environments/lowpoly-environment-nature-free-medieval-fantasy-series-187052
熱 - 完全な最新のUIは有料資産です。
https://assetstore.unity.com/packages/2d/gui/heat-complete-modern-ui-264857
Gui-casualfantasyは有料資産です。
https://assetstore.unity.com/packages/2d/gui/gui-casual-fantasy-265651
Unity Chan Animationは、Unity Technology JapanおよびUC2ライセンスの下で所有されています。
中世のアニメーションメガパックは有料資産です。
https://assetstore.unity.com/packages/3d/animations/medieval-animations-mega-pack-12141
Unity Starter AssetはUnityコンパニオンライセンスの下にあり、Assetstoreで無料でダウンロードできます。
https://assetstore.unity.com/packages/essentials/starter-assets-thirdperson-updates-in-new-charactercontroller-pa-196526
UNIVRMはMITライセンスを取得しています。
https://github.com/vrm-c/univrm
AkiframeworkはMITライセンスの下にあります。
https://github.com/akikurisu/akiframework
デモで使用されるその他のアニメーション、音楽、UI、およびフォントリソースはネットワークリソースであり、商業目的で使用するべきではありません。
@misc{realagents,
author = {YiFei Feng},
title = {Real Agents: An planning framework for generative artificial intelligence agents},
year = {2024},
publisher = {GitHub},
journal = {https://github.com/AkiKurisu/Real-Agents},
school = {East China University of Political Science and Law},
location = {Shanghai, China}
}
Steve Rabin、 Game AI Pro 3:Game AI Professionals、International Standard Bookの知恵を集めました。
[Orkin 06] Orkin、J。2006。3州と計画:恐怖のAI 、ゲーム開発者会議、サンフランシスコ、カリフォルニア
ジュン・ソン・パーク、ジョセフ・C・オブライエン、キャリー・J・カイ、メレディス・リンゲル・モリス、パーシー・リアン、マイケル・S・バーンスタイン。 2023年。生成エージェント:人間の行動のインタラクティブなシミュレーション。
王、Zihao et al。 「説明、説明、計画、選択:大規模な言語モデルを使用したインタラクティブな計画により、オープンワールドのマルチタスクエージェントが可能になります。」 arxiv abs/2302.01560(2023):n。パグ。
Lin J、Zhao H、Zhang A、他Agentsims:大規模な言語モデル評価のためのオープンソースサンドボックス[J]。 arxiv preprint arxiv:2308.04026、2023。
Xi、Z.、Chen、W.、Guo、X.、He、W.、Ding、Y.、Hong、B.、Zhang、M.、Wang、J.、Jin、S.、Zhou、E.、Zheng、R.、Fan、X.、Wang、X.、Xiong、L.、Liu、Q.、Y. Yin、Z.、Dou、S.、Weng、R.、Cheng、W.、Zhang、Q.、Qin、W.、Zheng、Y.、Qiu、X.、Huan、X。、&Gui、T。(2023)。大規模な言語モデルベースのエージェントの上昇と可能性:調査。 Arxiv、ABS/2309.07864。