ゲームの世界では、本当の王は誰ですか?最近、AIテクノロジーは、広範な注目を集めている古典的なゲーム「Super Mario Brothers」に挑戦しています。カリフォルニア大学のHAO人工知能研究所は、サンディエゴが衝撃的な研究結果を発表しました。AI「マリオ」の戦いで、人類のクロード3.7モデルが際立って、他の競争相手を打ち負かし、「The Strongest AI Mario」のタイトルを獲得しました。 Claude 3.5の後に続いて、GoogleのGemini1.5 ProとOpenaiのGPT-4oはパフォーマンスが低いですが、これは驚くべきことです。この結果は、AIテクノロジーに関する新しい考え方を引き起こしました。
このAIの「Malio」トーナメントは、従来の赤と白のマシンで行われたのではなく、ハイテクシミュレーターでプレイされました。研究者は、AIとゲームの世界の間の橋として機能するために、Gamingagentというフレームワークを開発しました。この仮想環境では、AIは「Malio」になり、システムの命令を受信することでゲームを制御します。指示には「障害があります!ジャンプ!」そして、「敵が来ている!ダッジ!」、それはシンプルで明確ですが挑戦的です。また、このシステムは、AIがゲームシーンをよりよく理解できるように、ゲームスクリーンショットを提供します。さらに驚くべきことは、AIがPythonコードをリアルタイムで記述し、さまざまな複雑な操作を完了するように指示し、非常に高い技術レベルを示すことができることです。

しかし、ゲームの結果は予想外でした。 OpenaiのO1などの推論機能で知られている一部のAIモデルは、予想よりもはるかに少ないパフォーマンスを発揮します。その理由は、これらの「推論マスター」はリアルタイムゲームであまりにもゆっくりと反応し、迅速に決定を下すことができないためです。 「Super Mario Brothers」のようなゲームでは、数秒の遅延が失敗につながる可能性があります。したがって、反応速度が結果を決定する重要な要因になりました。この発見は、リアルタイムのタスクにおけるAIの限界を明らかにし、将来の研究のための新しい方向性も提供します。
ゲームはAI競争の重要な段階になっていますが、一部の専門家はこれについて留保されています。彼らは、ゲームの世界はあまりにも単純で抽象的であり、現実の世界でのAIの能力を完全に反映するには抽象的であると信じています。 AIはゲームでの経験を継続的に蓄積することができますが、これらの経験を実用的なアプリケーションに変換できるかどうかは、まだ検証されていません。 Openaiの研究科学者のAndre Kapasiは、「評価危機」について疑問を提起しました。これにより、AIテクノロジー評価の基準について人々の詳細な考えを引き起こしました。
疑いにもかかわらず、ゲームでのAIのパフォーマンスはまだ印象的です。この「マリオ」トーナメントは、AIテクノロジーの急速な発展を実証するだけでなく、未来を見るためのウィンドウを提供します。かつてチェスボードでしか計画できなかったAIが、ゲームの世界でその強さを示すことができると誰が思ったでしょうか?おそらく近い将来、AIは人間のプレイヤーを本当に上回り、ゲーム業界の本当の王になることができます。このテクノロジーの将来の発展を待って見て目撃しましょう。