Du codage à l'écriture créative Xai Grok-3 a vaincu GPT4.5 pour atteindre le sommet de l'arène Big Model - AI Articles

Auteur：Eve Cole Date de mise à jour：2025-05-16 13:50:02

Xai a récemment publié une nouvelle passionnante, avec son dernier modèle d'IA Grok-3 en œuvre sur le plan exceptionnel sur le classement des arènes du chatbot. Le modèle, appelé "Grok-3Preview-02-24", a démontré ses capacités puissantes dans de nombreux domaines clés et est devenu un point culminant dans le domaine de l'IA.

Dans la concurrence féroce de Chatbot Arena, Grok-3-Preview-02-24 a dépassé GPT4.5-Preview par une marge étroite de 1 point, gagnant plus de 3 000 voix pour égaliser la première place. Le modèle fonctionne particulièrement bien dans la gestion des indices complexes, les tâches de codage, les problèmes mathématiques, l'écriture créative, la conformité pédagogique et les longues requêtes. Chatbot Arena est une plate-forme de crowdsourcing pour l'évaluation du modèle de langue à grande échelle (LLM) par le biais des préférences humaines et utilise le système de notation ELO pour classer les modèles, fournissant des mesures de performance complètes.

Cette réalisation marque non seulement un progrès significatif dans le domaine de l'IA, mais reflète également les ambitions du fondateur Elon Musk de promouvoir le développement de la technologie de l'IA. Musk s'est engagé à développer de puissants systèmes d'IA qui sont cohérents avec les valeurs humaines, et le succès de Grok-3 est sans aucun doute un puissant témoignage de cette vision.

Il convient de noter que "GROK-3PREVIEW-02-24" est décrit comme le dernier modèle de production, mais le mot "prévisualisation" en son nom peut indiquer que le modèle est toujours en phase de test. Ce détail a déclenché des discussions sur sa préparation à la production complète, tout en laissant de la place à l'optimisation et aux mises à niveau futures.