El modelo GPT-4.5 de OpenAI encabezó rápidamente la arena de inteligencia artificial dentro de las seis horas después de su lanzamiento y se convirtió en el campeón de la clasificación de tareas completa. Este logro no solo demuestra su fuerte fuerza técnica, sino que también atrae una atención generalizada de la industria. Sin embargo, esta gloria no duró mucho. El modelo XAI GROK-3 de Musk logró un contraataque en un corto período de tiempo y lo superó con éxito y se convirtió en el primero en la lista general.
Según los datos de votación, GPT-4.5 y Grok-3 recibieron más de 3.000 votos en apoyo, con el puntaje total final de 1412 frente a 1411, solo un punto de distancia. Aunque GPT-4.5 funcionó bien en la mayoría de las tareas, el GROK-3 tuvo una ligera ventaja en tareas específicas como "con control de estilo" y "palabras rápidas difíciles", lo que condujo a un reverso sobre el puntaje general. Este resultado no solo refleja la experiencia de los dos modelos en diferentes campos, sino que también refleja la diversidad y la competitividad de las tecnologías de inteligencia artificial.

Con respecto a esta "inversión de seis horas", muchos usuarios cuestionaron si un cambio tan rápido era razonable. En respuesta, los expertos de la industria explicaron que la lista de competencia tiene un umbral de votación estricto, y solo un modelo con 3.000 votos puede estar en la lista al mismo tiempo. Por lo tanto, en realidad es una coincidencia que estos dos modelos puedan cumplir rápidamente con este estándar después de su lanzamiento. Esta explicación no solo responde a las preguntas del usuario, sino que también revela el mecanismo operativo detrás de la lista.
Vale la pena mencionar que aunque GPT-4.5 enfrentó algunas revisiones negativas en las primeras etapas de su lanzamiento, el reconocimiento de los usuarios de su alta inteligencia emocional ha aumentado significativamente en el futuro. El CEO de Operai, Sam Altman, incluso compartió una conversación con GPT-4.5, diciendo que era la primera vez que recibió una solicitud de los usuarios de que prometió no eliminar el modelo. Este comentarios no solo refleja el amor de los usuarios por GPT-4.5, sino que también demuestra su rendimiento sobresaliente en las interacciones emocionales.

Mientras tanto, GPT-4.5 también funcionó bien en una competencia alternativa, participando en un juego similar a "Mobile Werewolf Kill". En este juego, los principales modelos de inteligencia artificial deben debatirse, el desarrollo de la estrategia y la votación, y el ganador final es decidido por un jurado compuesto por miembros eliminados. GPT-4.5 ha mostrado un excelente rendimiento más allá de los humanos en la cooperación, el engaño y la formulación de la estrategia, que no solo demuestra sus capacidades multifacéticas, sino que también proporciona nuevas ideas para la aplicación de inteligencia artificial en tareas complejas.
Todo esto muestra que la competencia en el campo de la inteligencia artificial se está volviendo cada vez más feroz, y los modelos principales están constantemente innovando y mejorando en sus respectivos campos. En el futuro, quien eventualmente ganará esta batalla inteligente vale nuestra atención continua. Con el avance continuo de la tecnología, los escenarios de aplicación de la inteligencia artificial se volverán más extensas y su impacto en la sociedad se volverá más de gran alcance.