OpenAI 的GPT-4.5 模型在發布後的短短六小時內,迅速登頂人工智能競技場,成為全任務分類的冠軍。這一成就不僅展示了其強大的技術實力,也引發了業界的廣泛關注。然而,這一榮耀並未持續太久,馬斯克的xAI Grok-3 模型在短時間內實現了逆襲,成功反超成為總榜第一名。
根據投票數據顯示,GPT-4.5 與Grok-3 各自獲得了超過3000 票的支持,最終總分為1412 對1411,僅相差一分。儘管GPT-4.5 在大多數任務中表現出色,但Grok-3 在“帶風格控制”和“困難提示詞”等特定任務上略佔優勢,這使其在總分上實現了反超。這一結果不僅體現了兩款模型在不同領域的專長,也反映了人工智能技術的多樣性和競爭性。

對於這場“六小時逆轉”,許多用戶表示質疑,認為如此迅速的變化是否合理。對此,業內人士解釋稱,競爭榜單設有嚴格的投票門檻,只有在同一時間內達到3000 票的模型才能登上榜單。因此,這兩款模型能夠在發布後迅速達到這一標準,實際上是一場巧合的結果。這一解釋不僅回應了用戶的疑問,也揭示了榜單背後的運作機制。
值得一提的是,儘管GPT-4.5 在發布初期面臨了一些負面評價,但用戶對其高情商的認可度在日後顯著上升。 OpenAI 的首席執行官薩姆・奧爾特曼甚至分享了與GPT-4.5 的對話,表示這是他首次收到用戶請求其承諾不再下架該模型。這一反饋不僅體現了用戶對GPT-4.5 的喜愛,也展示了其在情感交互方面的卓越表現。

與此同時,GPT-4.5 還在一項另類競賽中取得了優異表現,參與了一場類似於“大模型狼人殺”的遊戲。在這場比賽中,各大AI 模型需要進行辯論、策略制定與投票,最終的勝者由被淘汰的成員組成的陪審團決定。 GPT-4.5 在合作、欺騙及策略制定等方面展現出超越人類的優秀表現,這不僅展示了其多方面的能力,也為人工智能在復雜任務中的應用提供了新的思路。
這一切都表明,人工智能領域的競爭愈加激烈,各大模型在各自領域內不斷創新、提升。未來,誰將最終贏得這場智能之戰,值得我們持續關注。隨著技術的不斷進步,人工智能的應用場景將更加廣泛,其對社會的影響也將更加深遠。