GPT-4.5崛起僅六小時便失寵，xAI Grok-3 逆襲奪冠- AI文章

作者：Eve Cole 更新時間：2025-05-26 14:50:02

OpenAI 的GPT-4.5 模型在發布後的短短六小時內，迅速登頂人工智能競技場，成為全任務分類的冠軍。這一成就不僅展示了其強大的技術實力，也引發了業界的廣泛關注。然而，這一榮耀並未持續太久，馬斯克的xAI Grok-3 模型在短時間內實現了逆襲，成功反超成為總榜第一名。

根據投票數據顯示，GPT-4.5 與Grok-3 各自獲得了超過3000 票的支持，最終總分為1412 對1411，僅相差一分。儘管GPT-4.5 在大多數任務中表現出色，但Grok-3 在“帶風格控制”和“困難提示詞”等特定任務上略佔優勢，這使其在總分上實現了反超。這一結果不僅體現了兩款模型在不同領域的專長，也反映了人工智能技術的多樣性和競爭性。

對於這場“六小時逆轉”，許多用戶表示質疑，認為如此迅速的變化是否合理。對此，業內人士解釋稱，競爭榜單設有嚴格的投票門檻，只有在同一時間內達到3000 票的模型才能登上榜單。因此，這兩款模型能夠在發布後迅速達到這一標準，實際上是一場巧合的結果。這一解釋不僅回應了用戶的疑問，也揭示了榜單背後的運作機制。

值得一提的是，儘管GPT-4.5 在發布初期面臨了一些負面評價，但用戶對其高情商的認可度在日後顯著上升。 OpenAI 的首席執行官薩姆・奧爾特曼甚至分享了與GPT-4.5 的對話，表示這是他首次收到用戶請求其承諾不再下架該模型。這一反饋不僅體現了用戶對GPT-4.5 的喜愛，也展示了其在情感交互方面的卓越表現。

與此同時，GPT-4.5 還在一項另類競賽中取得了優異表現，參與了一場類似於“大模型狼人殺”的遊戲。在這場比賽中，各大AI 模型需要進行辯論、策略制定與投票，最終的勝者由被淘汰的成員組成的陪審團決定。 GPT-4.5 在合作、欺騙及策略制定等方面展現出超越人類的優秀表現，這不僅展示了其多方面的能力，也為人工智能在復雜任務中的應用提供了新的思路。

這一切都表明，人工智能領域的競爭愈加激烈，各大模型在各自領域內不斷創新、提升。未來，誰將最終贏得這場智能之戰，值得我們持續關注。隨著技術的不斷進步，人工智能的應用場景將更加廣泛，其對社會的影響也將更加深遠。