O modelo GPT-4.5 do OpenAI rapidamente liderou a arena de inteligência artificial dentro de apenas seis horas após seu lançamento e se tornou o campeão da classificação completa da tarefa. Essa conquista não apenas demonstra sua forte força técnica, mas também atrai atenção generalizada da indústria. No entanto, essa glória não durou muito. O modelo Xai Grok-3 de Musk alcançou um contra-ataque em um curto período de tempo e o ultrapassou com sucesso e se tornou o primeiro da lista geral.
De acordo com os dados de votação, o GPT-4.5 e o GROK-3 receberam mais de 3.000 votos de apoio, com a pontuação total final de 1412 vs. 1411, apenas um ponto de intervalo. Embora o GPT-4.5 tenha um bom desempenho na maioria das tarefas, o GROK-3 teve uma pequena vantagem em tarefas específicas, como "com controle de estilo" e "palavras rápidas difíceis", o que levou a um inverso sobre a pontuação geral. Esse resultado não apenas reflete a experiência dos dois modelos em diferentes campos, mas também reflete a diversidade e a competitividade das tecnologias de inteligência artificial.

Em relação a essa "reversão de seis horas", muitos usuários questionaram se uma mudança tão rápida era razoável. Em resposta, os especialistas do setor explicaram que a lista de competições tem um limite de votação estrita, e apenas um modelo com 3.000 votos pode estar na lista ao mesmo tempo. Portanto, é realmente uma coincidência que esses dois modelos possam atender rapidamente a esse padrão após o lançamento. Essa explicação não apenas responde às perguntas do usuário, mas também revela o mecanismo operacional por trás da lista.
Vale ressaltar que, embora o GPT-4.5 tenha enfrentado algumas críticas negativas nos estágios iniciais de seu lançamento, o reconhecimento dos usuários de sua alta inteligência emocional aumentou significativamente no futuro. O CEO da Openai, Sam Altman, chegou a compartilhar uma conversa com o GPT-4.5, dizendo que foi a primeira vez que ele recebeu um pedido dos usuários que prometeu não remover o modelo. Esse feedback não apenas reflete o amor dos usuários pelo GPT-4.5, mas também demonstra seu excelente desempenho em interações emocionais.

Enquanto isso, o GPT-4.5 também teve um bom desempenho em uma competição alternativa, participando de um jogo semelhante ao "Mobile Lobisom Kill". Neste jogo, os principais modelos de IA precisam ser debatidos, desenvolvimento e votação da estratégia, e o vencedor final é decidido por um júri composto por membros eliminados. O GPT-4.5 mostrou excelente desempenho além dos seres humanos em cooperação, engano e formulação de estratégia, que não apenas demonstra seus recursos multifacetados, mas também fornece novas idéias para a aplicação de inteligência artificial em tarefas complexas.
Tudo isso mostra que a concorrência no campo da inteligência artificial está se tornando cada vez mais feroz, e os principais modelos estão constantemente inovando e melhorando em seus respectivos campos. No futuro, quem acabará vencendo esta batalha inteligente vale nossa atenção contínua. Com o avanço contínuo da tecnologia, os cenários de aplicação da inteligência artificial se tornarão mais extensos e seu impacto na sociedade se tornará mais abrangente.