OpenaiのGPT-4.5モデルは、リリースからわずか6時間以内に人工知能アリーナをすぐに突破し、完全なタスク分類のチャンピオンになりました。この成果は、その強力な技術的強さを実証するだけでなく、業界からの広範な注目を集めています。しかし、この栄光は長く続きませんでした。 MuskのXai Grok-3モデルは、短期間で反撃を達成し、それを監視し、リスト全体で最初になりました。
投票データによると、GPT-4.5とGROK-3はそれぞれ3,000票以上の票を獲得し、最終的な合計スコアは1412対1411で、1ポイントしか離れていませんでした。 GPT-4.5はほとんどのタスクでうまく機能しましたが、GROK-3は「スタイルコントロールを使用して」や「困難な迅速な単語」などの特定のタスクでわずかな利点があり、全体的なスコアを逆転させました。この結果は、異なる分野の2つのモデルの専門知識を反映するだけでなく、人工知能技術の多様性と競争力も反映しています。

この「6時間の逆転」に関して、多くのユーザーは、このような急速な変化が妥当であるかどうかを疑問視しました。これに応じて、業界のインサイダーは、競争リストには厳格な投票のしきい値があり、3,000票のモデルのみが同時にリストに載ることができると説明しました。したがって、実際には、これら2つのモデルがリリース後にこの基準を迅速に満たすことができるのは偶然です。この説明は、ユーザーの質問に応答するだけでなく、リストの背後にある動作メカニズムも明らかにします。
GPT-4.5は、リリースの初期段階でいくつかの否定的なレビューに直面しているが、ユーザーの高い感情的知性の認識が将来大幅に増加していることに言及する価値がある。 Openai CEOのSam Altmanは、GPT-4.5と会話を共有し、モデルを削除しないと約束したユーザーからリクエストを受け取ったのは初めてだと言った。このフィードバックは、GPT-4.5に対するユーザーの愛を反映するだけでなく、感情的な相互作用における優れたパフォーマンスも示しています。

一方、GPT-4.5は、「Mobile Wearwolf Kill」に似たゲームに参加して、代替競争でもうまく機能しました。このゲームでは、主要なAIモデルについて議論する必要があり、戦略開発と投票が必要であり、最終的な勝者は廃止されたメンバーで構成されるju審員によって決定されます。 GPT-4.5は、協力、欺ception、戦略の定式化において人間を超えた優れたパフォーマンスを示しています。これは、その多面的な機能を実証するだけでなく、複雑なタスクで人工知能を適用するための新しいアイデアを提供します。
これらはすべて、人工知能の分野での競争がますます激しくなっており、主要なモデルがそれぞれの分野で常に革新と改善を行っていることを示しています。将来的には、最終的にこの賢い戦いに勝つことは、私たちの継続的な注意の価値があります。テクノロジーの継続的な進歩により、人工知能のアプリケーションシナリオがより広範になり、社会への影響がより広範囲になります。