La société d'intelligence artificielle d'Elon Musk XAI a publié son dernier modèle de langue Grok3 ce lundi, une version marquant un progrès significatif que la société a réalisé dans le domaine de l'intelligence artificielle. Musk a révélé lors de la conférence de presse que le nouveau modèle a dix fois la puissance de calcul de son prédécesseur, grâce au centre de données basé à Memphis, qui est équipé d'environ 200 000 GPU, fournissant un fort support de puissance de calcul pour le modèle.
Les modèles de la série Grok3 ont lancé une variété de variantes, y compris une version rationalisée qui sacrifie une partie de la précision tout en augmentant la vitesse. De plus, le modèle «d'inférence» nouvellement lancé est conçu spécifiquement pour résoudre des problèmes mathématiques et scientifiques, et les utilisateurs peuvent ajuster ces fonctionnalités via les paramètres «penser» et «cerveau» dans l'interface Grok. Xai a déclaré que cette version n'avait pas encore été finalisée, le modèle est toujours en cours de formation en continu et que l'équipe prévoit d'apporter de nouvelles améliorations et optimisations dans les prochaines semaines.
Selon la plate-forme d'analyse comparative de l'IA Lmarena.ai, Grok3 a marqué plus de 1 400 dans le champ de chatbot, devenant un leader dans le domaine. Il excelle dans toutes les catégories telles que la programmation, le dépassement des modèles OpenAI, anthropic et Google. Cependant, les performances réelles peuvent différer des résultats de référence. Par exemple, bien que Claude3.5SonNet score inférieur à certains modèles dans les références de codage, de nombreux utilisateurs le considèrent toujours comme un meilleur choix pour la programmation des tâches.
Le fondateur d'OpenAI, Andrej Karpathy, a reçu un accès précoce à Grok3 et il a fortement salué la capacité de raisonnement logique du modèle. Karpasi a déclaré que la fonctionnalité "Think" peut gérer avec succès des tâches complexes telles que le calcul des flops d'entraînement GPT-2 ou la création d'un maillage hexagonal pour les jeux de société, qui étaient auparavant limités au modèle haut de gamme d'OpenAI uniquement. De plus, cette caractéristique améliore la précision des opérations mathématiques de base, telles que le comptage des lettres et la comparaison des décimales.
En termes de nouvelles capacités de recherche, Karpasi a noté que la qualité de Deepsearch est comparable aux outils de recherche de Perplexity, fournissant des réponses pertinentes à des sujets tels que les produits Apple à venir et la dynamique des actions de Palantir. Cependant, il a également trouvé des problèmes évidents: le modèle génère parfois de fausses URL, fait des déclarations non soutenues et cite uniquement les messages de X à des invites spécifiques.
De plus, Grok3 semble également avoir un manque de conscience de son existence, manquant l'emplacement de XAI dans les principaux laboratoires AI. Ces limitations ont laissé la recherche en profondeur non encore au niveau de qualité des «recherches profondes» d'Openai et sous-performantes sur l'humour et les questions éthiques. Néanmoins, le lancement de Grok3 démontre toujours la forte force et les capacités d'innovation de XAI dans le domaine de l'intelligence artificielle.