El 3 de marzo de 2025, Tongyi Lingma lanzó oficialmente su último modelo de inferencia, Qwen2.5-Max, que proporciona a los desarrolladores una potente programación y capacidades matemáticas. El lanzamiento de Qwen2.5-Max marca otro gran avance en la tecnología de inteligencia artificial en los campos de programación y matemáticas. El modelo se basa en datos de pre-entrenamiento de más de 20 billones de tokens y se combina con un esquema posterior a la capacitación cuidadosamente diseñado, lo que lleva a nuevas alturas en el rendimiento.
Qwen2.5-Max funcionó particularmente bien en varios puntos de referencia. Por ejemplo, en pruebas como Arena-Hard, LiveBench, LivecodeBench y GPQA-Diamond, Qwen2.5-Max superan a otros modelos líderes en la industria, incluidos Deepseek V3, GPT-4O y Claude-3.5-Sonnet. Además, en MMLU-Pro y otras evaluaciones, Qwen2.5-Max también mostró resultados extremadamente competitivos, lo que demuestra aún más su capacidad sobresaliente en tareas complejas.

En la comparación del modelo base, Qwen2.5-Max se comparó de manera integral con Deepseek V3, Llama-3.1-405b y Qwen2.5-72b. Los resultados muestran que el modelo base de Tongyi Qianwen muestra ventajas significativas en la mayoría de los puntos de referencia, especialmente cuando se trata de programación compleja y problemas matemáticos, QWEN2.5-Max funciona particularmente bien.
Vale la pena señalar que en la última lista de pruebas ciegas de grandes modelos lanzados por la plataforma de prueba de referencia tripartita, Chatbot Arena, QWEN2.5-Max superó a modelos como Deepseek-V3, Open AI O1-Mini y Claude-3.5-Sonnet, clasificando el séptimo en el mundo con 1332 puntos, convirtiéndose en el campeón de los grandes modelos de China sin infreza. En términos de habilidades individuales, como matemáticas y programación, Qwen2.5-Max ocupa el primer lugar, y las indicaciones difíciles ocupan el segundo lugar. El funcionario de Chatbot Arena comentó que el QWEN2.5-Max de Alibaba se desempeñó fuertemente en muchos campos, especialmente en campos profesionales y técnicos como programación, matemáticas y indicaciones difíciles.
En la actualidad, Qwen2.5-Max se ha integrado en Tongyi Lingcode, y los usuarios pueden experimentar sus potentes capacidades de programación descargando el complemento Tongyi LingCode. Esta integración no solo proporciona a los desarrolladores herramientas más eficientes, sino que también abre nuevas posibilidades para la aplicación de la tecnología de inteligencia artificial.