En el mundo de los juegos, ¿quién es el verdadero rey? Recientemente, AI Technology ha desafiado el juego clásico "Super Mario Brothers", que ha atraído una atención generalizada. El Laboratorio de Inteligencia Artificial HAO de la Universidad de California, San Diego, lanzó un impactante resultado de la investigación: en una batalla de AI "Malio", el modelo Claude 3.7 de Anthrope se destacó, derrotando a otros competidores y ganando el título de "El Ai Mario más fuerte". Claude 3.5 es seguido por, mientras que el GPT-4O de Gemini1.5 de Google y el GPT-4O de Openai tienen un rendimiento inferior, lo cual es sorprendente. Este resultado ha provocado un nuevo pensamiento en la tecnología de IA.
Este torneo AI "Malio" no se jugó en una máquina tradicional roja y blanca, sino que se jugó en un simulador de alta tecnología. Los investigadores han desarrollado un marco llamado Gamingagent para servir como un puente entre la IA y el mundo de los juegos. En este entorno virtual, la IA se convierte en "Malio" y controla el juego al recibir instrucciones del sistema. Las instrucciones incluyen "¡Hay un obstáculo por delante! ¡Salta!" y "¡Se acerca el enemigo! Dodge!", Que son simples y claros pero desafiantes. El sistema también proporcionará capturas de pantalla del juego para ayudar a la IA a comprender mejor las escenas del juego. Lo que es aún más sorprendente es que la IA puede escribir el código de Python en tiempo real, dirigir "Malio" para completar varias operaciones complejas, mostrando un nivel técnico extremadamente alto.

Sin embargo, los resultados del juego fueron inesperados. Algunos modelos de IA conocidos por sus capacidades de razonamiento, como el O1 de OpenAI, funcionan mucho menos de lo esperado. La razón es que estos "maestros de razonamiento" reaccionan demasiado lentamente en los juegos en tiempo real y no pueden tomar decisiones rápidamente. En un juego como "Super Mario Brothers", un retraso de unos segundos puede conducir al fracaso. Por lo tanto, la velocidad de reacción se ha convertido en un factor clave para determinar el resultado. Este descubrimiento revela las limitaciones de la IA en las tareas en tiempo real y también proporciona nuevas direcciones para futuras investigaciones.
Aunque los juegos se han convertido en una etapa importante para la competencia de IA, algunos expertos están reservados sobre esto. Creen que el mundo de los juegos es demasiado simple y abstracto para reflejar completamente la capacidad de la IA en el mundo real. La IA puede acumular continuamente la experiencia en los juegos, pero aún no se puede verificar si estas experiencias pueden transformarse en aplicaciones prácticas. El científico de investigación de Operai Andre Kapasi incluso planteó preguntas sobre la "crisis de evaluación", que desencadenó el pensamiento profundo de las personas sobre los estándares para la evaluación de la tecnología de IA.
A pesar de las dudas, el rendimiento de AI en el juego sigue siendo impresionante. Este torneo "Malio" no solo demuestra el rápido desarrollo de la tecnología de IA, sino que también nos proporciona una ventana para ver el futuro. ¿Quién hubiera pensado que la IA, que una vez solo podría planificar en el tablero de ajedrez, ahora puede mostrar su fuerza en el mundo del juego? Quizás en el futuro cercano, la IA realmente puede superar a los jugadores humanos y convertirse en el verdadero rey de la industria del juego. Esperemos y veamos y presenciemos el desarrollo futuro de esta tecnología.