Di dunia game, siapa raja yang sebenarnya? Baru -baru ini, AI Technology telah menantang permainan klasik "Super Mario Brothers", yang telah menarik perhatian luas. Laboratorium Intelijen Buatan Hao dari University of California, San Diego merilis hasil penelitian yang mengejutkan: dalam pertempuran "Malio" AI, model Claude 3.7 Anthropic menonjol, mengalahkan pesaing lain, dan memenangkan gelar "AI Mario terkuat". Claude 3.5 diikuti oleh, sedangkan Google Gemini1.5 Pro dan Openai GPT-4O berkinerja buruk, yang mengejutkan. Hasil ini telah memicu pemikiran baru tentang teknologi AI.
Turnamen AI "Malio" ini tidak dimainkan pada mesin merah dan putih tradisional, tetapi dimainkan dalam simulator teknologi tinggi. Para peneliti telah mengembangkan kerangka kerja yang disebut GamingAgent untuk melayani sebagai jembatan antara AI dan dunia game. Dalam lingkungan virtual ini, AI menjadi "Malio" dan mengontrol permainan dengan menerima instruksi sistem. Instruksi termasuk "Ada hambatan di depan! Lompat!" dan "Musuh akan datang! Dodge!", Yang sederhana dan jelas tetapi menantang. Sistem ini juga akan memberikan tangkapan layar game untuk membantu AI lebih memahami adegan game. Yang lebih menakjubkan adalah bahwa AI dapat menulis kode Python secara real time, "Malio" langsung untuk menyelesaikan berbagai operasi yang kompleks, menunjukkan tingkat teknis yang sangat tinggi.

Namun, hasil permainan tidak terduga. Beberapa model AI yang dikenal karena kemampuan penalaran mereka, seperti O1 Openai, berkinerja jauh lebih sedikit dari yang diharapkan. Alasannya adalah bahwa "master penalaran" ini bereaksi terlalu lambat dalam permainan real-time dan tidak dapat membuat keputusan dengan cepat. Dalam permainan seperti "Super Mario Brothers", penundaan beberapa detik dapat menyebabkan kegagalan. Oleh karena itu, kecepatan reaksi telah menjadi faktor kunci dalam menentukan hasil. Penemuan ini mengungkapkan keterbatasan AI dalam tugas real-time dan juga memberikan arahan baru untuk penelitian di masa depan.
Meskipun permainan telah menjadi tahap penting untuk kompetisi AI, beberapa ahli dicadangkan tentang hal ini. Mereka percaya bahwa dunia game terlalu sederhana dan abstrak untuk sepenuhnya mencerminkan kemampuan AI di dunia nyata. AI dapat terus mengakumulasi pengalaman dalam permainan, tetapi apakah pengalaman ini dapat diubah menjadi aplikasi praktis masih harus diverifikasi. Ilmuwan riset Openai Andre Kapasi bahkan mengajukan pertanyaan tentang "krisis penilaian", yang memicu pemikiran mendalam orang tentang standar evaluasi teknologi AI.
Terlepas dari keraguan, kinerja AI dalam permainan masih mengesankan. Turnamen "Malio" ini tidak hanya menunjukkan perkembangan cepat teknologi AI, tetapi juga memberi kita jendela untuk melihat masa depan. Siapa yang akan berpikir bahwa AI, yang dulu hanya bisa merencanakan di papan catur, sekarang dapat menunjukkan kekuatannya di dunia permainan? Mungkin dalam waktu dekat, AI benar -benar dapat melampaui pemain manusia dan menjadi raja yang asli dari industri game. Mari kita tunggu dan lihat dan saksikan pengembangan teknologi ini di masa depan.