AI vs. Super Mary! 클로드 3.7 : GPT-4O 인 Gemini는 완전히 지워져 게임 세계의 진정한 왕은 누구입니까? -AI 기사

저자：Eve Cole 업데이트 시간：2025-05-26 16:50:02

게임 세계에서 진정한 왕은 누구입니까? 최근 AI 기술은 클래식 게임 "Super Mario Brothers"에 도전했으며, 이는 광범위한 관심을 끌었습니다. 캘리포니아 대학교 (University of California)의 하오 인공 지능 연구소 (Hao Artificial Intelligence Laboratory)는 충격적인 연구 결과를 발표했습니다. AI "Malio"전투에서 Anthropic의 Claude 3.7 모델은 눈에 띄고 다른 경쟁자를 물리 치고 "The Strongest AI Mario"라는 제목을 얻었습니다. Claude 3.5는 이어지고 Google의 Gemini1.5 Pro와 Openai의 GPT-4O는 성능이 저하되어 놀랍습니다. 이 결과는 AI 기술에 대한 새로운 사고를 유발했습니다.

이 AI "Malio"토너먼트는 전통적인 빨간색과 흰색 기계에서 진행되지 않았지만 첨단 시뮬레이터에서 연주되었습니다. 연구원들은 AI와 Gaming World 사이의 다리 역할을하기 위해 GamingAgent라는 프레임 워크를 개발했습니다. 이 가상 환경에서 AI는 "Malio"가되어 시스템 지침을 수신하여 게임을 제어합니다. 지침에는 "앞으로의 장애물이 있습니다! 점프!" 그리고 "적은오고 있습니다! 닷지!", 그것은 단순하고 명확하지만 도전적입니다. 이 시스템은 또한 게임 스크린 샷을 제공하여 게임 장면을 더 잘 이해할 수 있도록 도와줍니다. 더 놀라운 점은 AI가 Python 코드를 실시간으로 작성하고 "Malio"를 다양한 복잡한 작업을 완료하도록 직접으로, 매우 높은 기술 수준을 보여줍니다.

그러나 게임의 결과는 예상치 못한 일이었습니다. OpenAi의 O1과 같은 추론 기능으로 알려진 일부 AI 모델은 예상보다 훨씬 적습니다. 그 이유는 이러한 "추론 마스터"가 실시간 게임에서 너무 느리게 반응하여 신속하게 결정을 내릴 수 없기 때문입니다. "Super Mario Brothers"와 같은 게임에서는 몇 초의 지연이 실패로 이어질 수 있습니다. 따라서 반응 속도는 결과를 결정하는 데 핵심 요소가되었습니다. 이 발견은 실시간 작업에서 AI의 한계를 나타내며 향후 연구를위한 새로운 방향을 제공합니다.

게임은 AI 경쟁의 중요한 단계가되었지만 일부 전문가들은 이에 대해 예약되어 있습니다. 그들은 게임 세계가 너무 단순하고 추상적이며 실제 세계에서 AI의 능력을 완전히 반영하기에는 추상적이라고 생각합니다. AI는 게임에서의 경험을 지속적으로 축적 할 수 있지만 이러한 경험을 실제 응용 분야로 전환 할 수 있는지 여부는 여전히 확인되어야합니다. Openai Research Scientist Andre Kapasi는 심지어 "평가 위기"에 대한 의문을 제기하여 AI 기술 평가 표준에 대한 사람들의 심층적 인 생각을 촉발 시켰습니다.

의심에도 불구하고 AI의 게임에서의 성능은 여전히 인상적입니다. 이 "Malio"토너먼트는 AI 기술의 빠른 발전을 보여줄뿐만 아니라 미래를 볼 수있는 창을 제공합니다. 한때 체스 판에서만 계획 할 수있는 AI가 이제 게임 세계에서 그 강점을 보여줄 수 있다고 누가 생각했을까요? 아마도 가까운 시일 내에 AI는 실제로 인간 플레이어를 능가하고 게임 산업의 진정한 왕이 될 수 있습니다. 이 기술의 미래 발전을 기다리고보고 목격합시다.