Google Gemini Exp 1114 est hors de nulle part! La première bataille a écrasé le GPT-4, et les évaluations de capacités multiples ont atteint le sommet pour choquer l'industrie - articles de l'IA

Auteur：Eve Cole Date de mise à jour：2025-02-06 00:16:01

La version expérimentale Gemini de Google Deepmind (EXP1114) a réalisé des réalisations remarquables sur la plate-forme Chatbot Arena. Montrer. Les résultats des tests montrent que GEMINI-EXP-1114 a égalé à la première place avec GPT-4-LAST dans les scores globaux, et a pris les devants dans de nombreux domaines clés tels que les mathématiques, le traitement rapide complexe et l'écriture créative, montrant son puissant multi-multi-multi-multi-multi-multi-multi-multi-multi-multi-multi-multi-multi-multi-multi-multi- capacités. Cela marque une augmentation significative de la compétitivité de Google dans le domaine des maquettes d'IA.

La dernière version expérimentale de Google Deepmind de Gemini (EXP1114) a obtenu des résultats remarquables sur la plate-forme Chatbot Arena. Après plus d'une semaine de tests communautaires, les données de plus de 6 000 voix ont été démontrées cumulativement que ce nouveau modèle dépasse ses concurrents avec un avantage significatif et montre une force incroyable dans plusieurs domaines clés.

En termes de notes globales, GEMINI-EXP-1114 a égalé à la première place avec GPT-4-LATEST avec d'excellents scores de plus de 40 points, dépassant la version GPT-4-Preview précédemment principale. Ce qui est encore plus étonnant, c'est que le modèle a atteint le sommet dans les domaines de base tels que les mathématiques, les invites complexes et l'écriture créative, montrant une force complète extrêmement forte.

Plus précisément, les progrès de Gemini-Exp-1114 sont impressionnants:

Du n ° 3 au sommet dans le classement total

L'évaluation des capacités mathématiques est passée du 3e au 1er

Un traitement rapide complexe est passé de la 4e à la 1ère place

La performance de l'écriture créative s'est améliorée de la 2e place à la 1ère place

Les capacités de traitement visuel se classent également en premier

Le niveau de programmation a également été amélioré du 5e au 3e

Google AI Studio a officiellement lancé cette nouvelle version pour que les utilisateurs puissent en faire l'expérience dans la pratique. Cependant, la communauté a également exprimé sa préoccupation concernant certains problèmes spécifiques, tels que la limite de 1 000 jetons existe toujours, et comment faire face à des problèmes de demande pratiques tels que la sortie de texte ultra-longue.

Les analystes de l'industrie estiment que cette progression révolutionnaire montre que l'investissement à long terme de Google dans le domaine de l'IA a commencé à récolter les résultats. Fait intéressant, le modèle maintient son 4ème classement dans le contrôle du style, ce qui peut impliquer que l'équipe de développement a adopté une nouvelle approche post-formation au lieu d'apporter des modifications au modèle de pré-formation.

Cette percée majeure a également déclenché des discussions sur la structure de l'industrie. OpenAI avait l'habitude de lancer de nouveaux produits lorsque les concurrents ont publié des mises à jour importantes, mais cette fois les progrès de Google ont attiré l'attention de l'industrie. Certaines personnes croient que cela peut annoncer l'arrivée de Gemini2, et la compétitivité de Google dans le domaine des grands modèles s'améliore considérablement.

Les performances exceptionnelles du GEMINI-EXP-1114 démontrent non seulement la forte force de Google dans le domaine de l'IA, mais assurent également une nouvelle inspiration pour la direction future de développement de la technologie de grand modèle, ce qui vaut la peine d'être attendu à l'avenir.