No mundo dos jogos, quem é o verdadeiro rei? Recentemente, a AI Technology desafiou o jogo clássico "Super Mario Brothers", que atraiu a atenção generalizada. O Hao Artificial Intelligence Laboratory da Universidade da Califórnia, San Diego divulgou um resultado chocante de pesquisa: em uma batalha "Malio" da IA, o modelo Claude 3.7 do Anthropic se destacou, derrotando outros concorrentes e conquistando o título de "The mais forte AI Mario". O Claude 3.5 é seguido por, enquanto o Gemini1.5 Pro e o OpenAI do Google e o GPT-4O do OpenAI são com baixo desempenho, o que é surpreendente. Esse resultado desencadeou um novo pensamento sobre a tecnologia de IA.
Este torneio de AI "Malio" não foi jogado em uma máquina tradicional vermelha e branca, mas foi tocada em um simulador de alta tecnologia. Os pesquisadores desenvolveram uma estrutura chamada GamingAgent para servir de ponte entre a IA e o mundo dos jogos. Nesse ambiente virtual, a IA se torna "Malio" e controla o jogo recebendo instruções do sistema. As instruções incluem "há um obstáculo à frente! Jump!" E "inimigo está chegando! Dodge!", Que são simples e claros, mas desafiadores. O sistema também fornecerá capturas de tela para ajudar a IA a entender melhor as cenas de jogo. O que é ainda mais incrível é que a IA pode escrever código Python em tempo real, diretamente "Malio" para concluir várias operações complexas, mostrando um nível técnico extremamente alto.

No entanto, os resultados do jogo foram inesperados. Alguns modelos de IA conhecidos por seus recursos de raciocínio, como o OpenAI's O1, realizam muito menos do que o esperado. O motivo é que esses "mestres de raciocínio" reagem muito lentamente em jogos em tempo real e não podem tomar decisões rapidamente. Em um jogo como "Super Mario Brothers", um atraso de alguns segundos pode levar ao fracasso. Portanto, a velocidade da reação tornou -se um fator -chave para determinar o resultado. Essa descoberta revela as limitações da IA em tarefas em tempo real e também fornece novas direções para futuras pesquisas.
Embora os jogos tenham se tornado um estágio importante para a competição de IA, alguns especialistas são reservados sobre isso. Eles acreditam que o mundo dos jogos é muito simples e abstrato para refletir completamente a capacidade da IA no mundo real. A IA pode acumular continuamente a experiência em jogos, mas se essas experiências podem ser transformadas em aplicações práticas ainda precisam ser verificadas. O cientista da OpenAI Research Andre Kapasi até levantou questões sobre a "crise de avaliação", que desencadeou o pensamento aprofundado das pessoas sobre os padrões para avaliação de tecnologia de IA.
Apesar das dúvidas, o desempenho da AI no jogo ainda é impressionante. Este torneio "Malio" não apenas demonstra o rápido desenvolvimento da tecnologia de IA, mas também nos fornece uma janela para ver o futuro. Quem pensaria que a IA, que antes só poderia planejar no tabuleiro de xadrez, agora pode mostrar sua força no mundo dos jogos? Talvez em um futuro próximo, a IA possa realmente superar os jogadores humanos e se tornar o verdadeiro rei da indústria de jogos. Vamos esperar e ver e testemunhar o desenvolvimento futuro dessa tecnologia.