3 марта 2025 года Tongyi Lingma официально выпустила свою последнюю модель вывода QWEN2.5-MAX, которая предоставляет разработчикам мощное программирование и математические возможности. Запуск QWEN2.5-Max отмечает еще один серьезный прорыв в технологии искусственного интеллекта в области программирования и математики. Модель основана на данных предварительного обучения более 20 триллионов токенов и в сочетании с тщательно разработанной схемой после тренировки, доведя ее до новой высоты в производительности.
QWEN2.5-MAX особенно хорошо показал в нескольких тестах. Например, в таких тестах, как Arena-Hard, Livebench, Livecodebench и GPQA-Diamond, оценки QWEN2,5-MAX превосходят другие ведущие модели в отрасли, включая DeepSeek V3, GPT-4O и Claude-3,5-Sonnet. Кроме того, в MMLU-PRO и других оценках QWEN2.5-MAX также показал чрезвычайно конкурентные результаты, что еще больше доказывает ее выдающуюся способность в сложных задачах.

При сравнении базовой модели QWEN2,5-MAX был всесторонне по сравнению с DeepSeek V3, Llama-3,1-405B и QWEN2,5-72B. Результаты показывают, что базовая модель Tongyi Qianwen показывает значительные преимущества в большинстве критериев, особенно при решении сложных программ и математических задач, QWEN2.5-Max особенно хорошо работает.
Стоит отметить, что в последнем списке слепых испытаний крупных моделей, выпущенных с помощью трехсторонней тестовой платформы The Chatbot Arena, QWEN2.5-MAX превзошли такие модели, как DeepSeek-V3, Open AI O1-Mini и Claude-3,5-Sonnet, заняв седьмые в мире 1332 очка, став чемпионом крупных моделей Китая. С точки зрения одноразовых способностей, таких как математика и программирование, QWEN2.5-MAX занимает первое место, а Hard подсказка занимает второе место. Чиновник Chatbot Arena прокомментировал, что QWEN2.5-Max от Alibaba решительно выступил во многих областях, особенно в профессиональных и технических областях, таких как программирование, математика и жесткие пособия.
В настоящее время QWEN2.5-Max был интегрирован в Tongyi Lingcode, и пользователи могут испытывать свои мощные возможности программирования, загрузив плагин Tongyi Lingcode. Эта интеграция не только предоставляет разработчикам более эффективные инструменты, но и открывает новые возможности для применения технологии искусственного интеллекта.