Google DeepmindのGemini Experimentalバージョン(EXP1114)は、1週間以上のコミュニティテストで顕著な成果を達成しました。見せる。 テスト結果は、GEMINI-EXP-1114が最初の場所でGPT-4-Latestが全体で結び付けられ、数学、複雑な迅速な処理、クリエイティブライティングなどの多くの重要な分野でリードを獲得し、その強力なマルチ - を示していることを示しています。能力。 これは、AIモックアップの分野でのGoogleの競争力の大幅な増加を示しています。
Google DeepmindのGemini(Exp1114)の最新の実験バージョンは、Chatbot Arenaプラットフォームで顕著な結果を達成しました。 1週間以上のコミュニティテストの後、6,000票以上のデータが累積的に示されており、この新しいモデルは競合他社が大きな利点を持ち、複数の重要な領域で驚くべき強さを示しています。

全体的な評価に関しては、GEMINI-EXP-1114は、40ポイント以上の優れたスコアでGPT-4-Latestで1位に結び付けられ、以前にリードするGPT-4-Previewバージョンを上回りました。さらに驚くべきことは、モデルが数学、複雑なプロンプト、創造的な執筆などのコアフィールドのトップに到達し、非常に強力な包括的な強さを示していることです。
具体的には、Gemini-Exp-1114の進捗状況は印象的です。
合計ランキングで3番からトップまで
数学的能力評価は3番目から1番目に上昇しました
複雑なプロンプト処理は、4位から1位に登りました
クリエイティブライティングのパフォーマンスは2位から1位に改善されました
視覚処理機能も最初にランク付けされます
プログラミングレベルも5番目から3番目に改善されました
Google AI Studioは、ユーザーが実際にそれを体験できるように、この新しいバージョンを正式に立ち上げました。ただし、コミュニティは、1,000トークンの制限が依然として存在するかどうかなど、いくつかの特定の問題についても懸念を表明しました。

業界のアナリストは、この画期的な進捗状況が、GoogleのAI分野への長期的な投資が結果を享受し始めたことを示していると考えています。興味深いことに、このモデルはスタイルコントロールで4番目のランキングを維持しています。これは、開発チームがトレーニング前モデルを変更する代わりに新しいトレーニング後のアプローチを採用していることを暗示している可能性があります。
この主要なブレークスルーは、業界構造に関する議論も引き起こしました。 Openaiは、競合他社が重要な更新をリリースしたときに新製品を発売するために使用されていましたが、今回はGoogleの進捗状況が業界の注目を集めています。一部の人々は、これがGemini2の到来を告げるかもしれないと信じており、Googleの大きなモデルの分野での競争力は大幅に改善されています。
Gemini-Exp-1114の優れたパフォーマンスは、AIの分野でのGoogleの強力な強さを示しているだけでなく、将来的に楽しみにしている大規模なモデルテクノロジーの将来の開発方向に新しいインスピレーションを提供します。