La nouvelle version d'essai Gemini de Google retrouve la première place dans la compétition IA, GPT-4o ne règne en maître qu'un jour

Auteur：Eve Cole Date de mise à jour：2025-01-24 15:24:01

Récemment, la concurrence entre les géants de l'IA Google et OpenAI s'est intensifiée. Les deux parties se livrent une concurrence féroce en termes de vitesse de développement et d'itération de modèles linguistiques à grande échelle. Le nouveau modèle Gemini-Exp-1121 de Google a surpassé le GPT-4o d'OpenAI dans de nombreux indicateurs clés, occupant une fois de plus la première place dans la compétition d'IA. L'éditeur de Downcodes vous donnera une compréhension approfondie de ce « blitz » dans le domaine de l'IA, ainsi que des dernières avancées technologiques et fonctionnelles entre les deux parties.

Récemment, la concurrence entre Google et OpenAI s’est à nouveau intensifiée. Juste un jour après que la nouvelle version de GPT-4o soit arrivée en tête de la liste des concurrents en IA, Google a lancé le dernier modèle expérimental Gemini-Exp-1121, regagnant rapidement le championnat. Il y a à peine une semaine, Google a publié Gemini-Exp-1114, ce qui semble indiquer que Google a réagi très rapidement à la dynamique d'OpenAI.

Jack Rae, scientifique en chef de Google DeepMind, a déclaré qu'il s'agissait d'un « blitz », ce qui implique que la vitesse d'itération de la post-formation est plus rapide que celle de la pré-formation.

Selon les informations officielles, Gemini-Exp-1121 a été considérablement amélioré à bien des égards, se reflétant principalement dans l'amélioration des capacités de codage, des capacités de raisonnement et des capacités de compréhension visuelle. De plus, ce modèle a atteint un niveau comparable à l'actuel top o1-preview et au New Sonnet3.5 dans le contrôle du style des mots d'invite complexes.

Lors des tests réels, Gemini-Exp-1121 a également obtenu de meilleurs résultats que la nouvelle version de GPT-4o dans la gestion de la compréhension des bandes dessinées. Ses réponses étaient plus complètes et il pouvait clairement utiliser des sous-titres et une emphase audacieuse pour présenter les informations. Dans la question de raisonnement logique classique d'Animal Crossing River, la réponse de Gemini-Exp-1121 était tout à fait correcte, montrant une capacité de raisonnement logique plus forte. D'un autre côté, la nouvelle version de GPT-4o a commis quelques erreurs.

Parallèlement, OpenAI développe également activement de nouvelles fonctionnalités. Récemment, le code de la fonction vidéo « Live Camera » a été découvert dans la dernière version de ChatGPT, ce qui marque ses progrès en matière de reconnaissance vocale et visuelle. Les utilisateurs d'OpenAI découvriront également cette fonctionnalité pour la première fois lors de l'utilisation du mode vocal avancé, démontrant son intention d'étendre l'utilisation de cette fonctionnalité à l'avenir.

Il est prévisible que l'année prochaine, la principale méthode de communication avec Chatbot passera progressivement du dialogue textuel traditionnel à la voix et à des services d'agents plus intelligents. Ce changement pourrait être conduit par le lancement de la fonction « caméra en direct ».

Cette compétition en matière d'IA se poursuit, Google et OpenAI se poursuivant, ce qui indique que la technologie de l'IA continuera de faire des percées et des innovations à l'avenir, offrant ainsi des services plus pratiques et plus intelligents aux utilisateurs. Attendons de voir qui gagnera à la fin !