Le 3 mars 2025, Tongyi Lingma a officiellement publié son dernier modèle d'inférence, Qwen2.5-Max, qui offre aux développeurs une programmation puissante et des capacités mathématiques. Le lancement de QWEN2.5-MAX marque une autre percée majeure de la technologie de l'intelligence artificielle dans les domaines de la programmation et des mathématiques. Le modèle est basé sur des données pré-formation de plus de 20 billions de jetons et combinée avec un schéma post-formation soigneusement conçu, ce qui les amenait à de nouveaux sommets en performance.
Qwen2.5-Max a particulièrement bien fonctionné dans plusieurs repères. Par exemple, dans des tests tels que Arena, dure, LiveBench, LivecodeBench et GPQA-Diamond, QWEN2.5-MAX dépassent les autres modèles de premier plan de l'industrie, notamment en profondeur V3, GPT-4O et Claude-3.5-Sonnet. De plus, dans MMLU-Pro et dans d'autres évaluations, QWEN2.5-MAX a également montré des résultats extrêmement compétitifs, ce qui prouve en outre sa capacité exceptionnelle dans des tâches complexes.

Dans la comparaison du modèle de base, Qwen2.5-max a été comparée à la V3 Deepseek, LLAMA-3.1-405B et QWEN2.5-72B. Les résultats montrent que le modèle de base de Tongyi Qianwen montre des avantages significatifs dans la plupart des références, en particulier lorsqu'ils traitent des programmes complexes et des problèmes mathématiques, Qwen2.5-Max fonctionne particulièrement bien.
Il convient de noter que dans la dernière liste de tests aveugles de grands modèles publiés par la plate-forme de test de référence tripartite Chatbot Arena, Qwen2.5-MAX a dépassé les modèles tels que Deepseek-V3, Open AI O1-MinI et Claude-3.5-Sonnet, se classant Seventh au monde avec 1332 points, devenant le champion des grands modèles de Chine. En termes de capacités à un seul élément telles que les mathématiques et la programmation, Qwen2.5-Max se classe en premier, et les invites difficiles se classent deuxième. Le responsable de Chatbot Arena a déclaré que QWEN2.5-Max d'Alibaba avait fortement fonctionné dans de nombreux domaines, en particulier dans des domaines professionnels et techniques tels que la programmation, les mathématiques et les invites difficiles.
À l'heure actuelle, Qwen2.5-Max a été intégré à Tongyi Lingcode, et les utilisateurs peuvent découvrir ses puissantes capacités de programmation en téléchargeant le plug-in Lingcode Tongyi. Cette intégration fournit non seulement aux développeurs des outils plus efficaces, mais ouvre également de nouvelles possibilités pour l'application de la technologie de l'intelligence artificielle.