Dans le monde du jeu, qui est le vrai roi? Récemment, la technologie de l'IA a contesté le jeu classique "Super Mario Brothers", qui a attiré une attention généralisée. Le Hao Artificial Intelligence Laboratory de l'Université de Californie à San Diego a publié un résultat de recherche choquant: dans une bataille de l'IA "Malio", le modèle Claude 3.7 d'Anthropic s'est démarqué, battant d'autres concurrents et remportant le titre de "The Strong Ai Mario". Claude 3.5 est suivi, tandis que les Gemini1.5 Pro de Google et le GPT-4O d'OpenAI sont sous-performants, ce qui est surprenant. Ce résultat a déclenché une nouvelle réflexion sur la technologie de l'IA.
Ce tournoi AI "Malio" n'a pas été joué sur une machine traditionnelle rouge et blanc, mais a été joué dans un simulateur de haute technologie. Les chercheurs ont développé un cadre appelé GamingAgent pour servir de pont entre l'IA et le monde du jeu. Dans cet environnement virtuel, l'IA devient "Malio" et contrôle le jeu en recevant des instructions système. Les instructions incluent "Il y a un obstacle à venir! Jump!" Et "Ennemi vient! Dodge!", qui sont simples et clairs mais stimulants. Le système fournira également des captures d'écran de jeu pour aider l'IA à mieux comprendre les scènes de jeu. Ce qui est encore plus étonnant, c'est que l'IA peut écrire du code Python en temps réel, directement "Malio" pour effectuer diverses opérations complexes, montrant un niveau technique extrêmement élevé.

Cependant, les résultats du jeu étaient inattendus. Certains modèles d'IA connus pour leurs capacités de raisonnement, tels que O1 d'OpenAI, fonctionnent beaucoup moins que prévu. La raison en est que ces «maîtres de raisonnement» réagissent trop lentement dans les jeux en temps réel et ne peuvent pas prendre des décisions rapidement. Dans un jeu comme "Super Mario Brothers", un délai de quelques secondes peut entraîner un échec. Par conséquent, la vitesse de réaction est devenue un facteur clé pour déterminer le résultat. Cette découverte révèle les limites de l'IA dans les tâches en temps réel et fournit également de nouvelles orientations pour les recherches futures.
Bien que les jeux soient devenus une étape importante pour la compétition d'IA, certains experts sont réservés à ce sujet. Ils croient que le monde du jeu est trop simple et abstrait pour refléter pleinement la capacité de l'IA dans le monde réel. L'IA peut accumuler continuellement l'expérience dans les jeux, mais il reste à vérifier si ces expériences peuvent être transformées en applications pratiques. Le chercheur d'OpenAI, Andre Kapasi, a même soulevé des questions sur la «crise de l'évaluation», ce qui a déclenché une réflexion approfondie des gens sur les normes pour l'évaluation de la technologie de l'IA.
Malgré les doutes, les performances de l'IA dans le jeu sont toujours impressionnantes. Ce tournoi "Malio" démontre non seulement le développement rapide de la technologie de l'IA, mais nous fournit également une fenêtre pour voir l'avenir. Qui aurait pensé que l'IA, qui, autrefois, ne pouvait que planifier l'échiquier, peut maintenant montrer sa force dans le monde du jeu? Peut-être que dans un avenir proche, l'IA peut vraiment dépasser les acteurs humains et devenir le vrai roi de l'industrie du jeu. Attendons et voyons et voyons le développement futur de cette technologie.