2025年2月27日、Openaiは最新の言語モデルGPT-4.5を正式にリリースしました。これは、調査プレビューバージョンとしてChatGPT Proユーザーに最初に開かれ、1か月あたり200米ドルのサブスクリプション料金がありました。 GPT-4oに基づいて構築されたこのモデルは、これまでで最大かつ最も知識のある言語モデルと広く見なされています。 GPT-4.5は、その推論能力、感情的知能、執筆やプログラミングなどの実用的な機能の大幅な改善を達成し、人工知能技術のもう1つの大きなブレークスルーをマークしています。 Openaiは、今後数週間で、GPT-4.5がPlus、チーム、エンタープライズ、EDUユーザーに徐々にオープンし、アプリケーション範囲をさらに拡大すると述べました。

GPT-4.5は、多くの分野で顕著な進歩を示しています。 OpenAIがリリースしたシステムカードによると、このモデルは、監視付きの微調整(SFT)および強化学習(RLHF)トレーニングを通じて「幻想」現象(すなわち、エラーまたは架空の情報)を大幅に削減し、感情的知性とユーザーの相互作用の自然さを改善します。たとえば、PersonQAテストでは、GPT-4.5の幻覚率は19%しかありませんでしたが、これはGPT-4Oの52%よりもはるかに低いです。ユーザーエクスペリエンスに関しては、GPT-4.5はライティングタスクとプログラミングタスクでうまく機能し、ユーザーの意図をより正確に理解しながら、より創造的で審美的に直感的なコンテンツを生成します。 Xユーザーのサイモン・ウィリソンは、裁判の後、「知識とコンテンツの生成の深さ(ペリカンの描画など)の点でより良いパフォーマンスを発揮し、より自然なインタラクティブな体験をしています。」さらに、モデルはファイルと画像のアップロードをサポートし、ChatGPTのCanvasツールを統合しますが、現在、音声、ビデオ、スクリーン共有などのマルチモーダル機能をサポートしていません。

Openaiは、GPT-4.5のトレーニングデータは、公開データ、独自のパートナーデータ、内部カスタマイズされたデータセットを含む多様なチャネルから来ていることを明らかにしました。セキュリティの観点から、モデルには、有害なコンテンツが生成されないように効果的に防止するための緩和APIと分類器が装備されています。サードパーティの評価では、Apollo ResearchとMetrはGPT-4.5の詐欺と自律性のリスクをテストし、その結果はその全体的なリスクが「中」であることを示しました。特に、化学、生物学、放射性核物質(CBRN)および説得の分野では、リスクは中程度ですが、サイバーセキュリティとモデルの自律性は低いです。 Openaiは、CBRNデータをフィルタリングし、潜在的な乱用を監視するための事前トレーニングなどの措置を講じており、セキュリティを確保しています。
ユーザーの最初のバッチからのフィードバックは、GPT-4.5が知識の幅と創造性の点で好評であることを示しました。 Xユーザー@PCKRAFTWERKは、その「幻覚現象を減らして、執筆とコーディングの能力が大幅に強化された」賞賛を称賛しました。しかし、速度の問題も注目を集めています。 Simon Willisonは、APIを介して使用すると、GPT-4.5が応答が遅く、リアルタイムアプリケーションシナリオに影響する可能性があると指摘しました。彼はまた、モデルがGPT-4の10倍多くのトレーニングコンピューティングリソースを使用していることを明らかにし、パフォーマンスの改善はその背後にある大きな投資であることを明らかにしました。さらに、Openaiは、GPT-4.5が深い推論のために設計されていないことを明らかにしました。複雑な推論が必要な場合は、ユーザーがO1またはO3-MINIモデルを選択することをお勧めします。このポジショニングは、いくつかの議論も引き起こしました。

Openaiの最新の傑作として、GPT-4.5は、執筆、プログラミング、問題解決などの分野で生産性の革新を促進すると考えられています。その多言語のパフォーマンスも印象的です。 MMLUベンチマークテストでは、英語の精度率は0.896、スペイン語0.8840、アラビア語0.8598に達し、あらゆる面でGPT-4Oを上回りました。業界のインサイダーは、GPT-4.5を徐々に促進することで、その強力な機能と高いセキュリティがAI分野でのOpenaiの主要な位置をさらに統合すると予測しています。将来的には、OpenAIはユーザーのフィードバックに基づいてモデルを最適化する予定であり、音声やビデオなどの機能を拡張してアプリケーションシナリオをさらに強化することを計画しています。
GPT-4.5のリリースは、Openaiの技術的野望を実証するだけでなく、セキュリティとユーザーエクスペリエンスに重点を置いていることを強調しています。速度の問題はまだ解決されていませんが、このモデルは間違いなくAIの開発に関する新しい章を開きます。 Openaiが声明の中で述べたように、「GPT-4.5がユーザーがより賢く、より信頼性の高いアシスタントエクスペリエンスを提供することを願っています。」