Am 3. März 2025 veröffentlichte Tongyi Lingma offiziell sein jüngstes Inferenzmodell Qwen2.5-max, das Entwicklern leistungsstarke Programmier- und mathematische Fähigkeiten bietet. Der Start von QWEN2.5-MAX markiert einen weiteren großen Durchbruch in der künstlichen Intelligenztechnologie in den Bereichen Programmierung und Mathematik. Das Modell basiert auf Voraussetzungsdaten von über 20 Billionen Token und kombiniert mit einem sorgfältig gestalteten Post-Training-Schema, das es auf neue Leistungshöhen bringt.
Qwen2.5-max lief in mehreren Benchmarks besonders gut ab. In Tests wie Arena-Hard, LiveBench, LivecodeBench und GPQA-Diamond beispielsweise übertreffen QWEN2.5-MAX-Ergebnisse andere führende Modelle der Branche, einschließlich Deepseek V3, GPT-4O und Claude-3,5-SONNET. Darüber hinaus zeigte QWEN2.5-Max in MMLU-PRO und anderen Bewertungen auch äußerst wettbewerbsfähige Ergebnisse, was seine herausragenden Fähigkeiten bei komplexen Aufgaben weiter nachweist.

Im Vergleich des Basismodells wurde Qwen2.5-max im Vergleich zu Deepseek V3, Lama-3,1-405b und Qwen2.5-72b umfassend verglichen. Die Ergebnisse zeigen, dass das Basismodell von Tontonyi Qianwen in den meisten Benchmarks signifikante Vorteile zeigt, insbesondere wenn es sich um komplexe Programmier- und mathematische Probleme handelt. QWEN2.5-Max funktioniert besonders gut.
Es ist erwähnenswert, dass in der neuesten Blind Testliste großer Modelle, die von der Tripitite Benchmark-Testplattform Chatbot Arena veröffentlicht wurden, QWEN2.5-Max Modelle wie Deepseek-V3, Open AI O1-Mini und Claude-3,5-SONNET übertroffen haben, die den siebten Siebten in der Welt mit 1332 Punkten, die Champion of China's Nicht-Inferenz-Big-Modelle, rangieren. In Bezug auf einzelne Elemente wie Mathematik und Programmierung belegt Qwen2.5-max zuerst und harte Eingabeaufforderungen an zweiter Stelle. Der Beamte der Chatbot Arena kommentierte, dass Alibabas QWEN2.5-Max in vielen Bereichen, insbesondere in professionellen und technischen Bereichen wie Programmierung, Mathematik und harten Aufforderungen, stark durchgeführt wurde.
Gegenwärtig wurde QWEN2.5-max in Tongyi Lingcode integriert, und Benutzer können ihre leistungsstarken Programmierfunktionen durch das Herunterladen von Tongyi Lingcode-Plug-In erleben. Diese Integration bietet Entwicklern nicht nur effizientere Tools, sondern eröffnet auch neue Möglichkeiten für die Anwendung der Technologie für künstliche Intelligenz.