Pada 3 Maret 2025, Tongyi Lingma secara resmi merilis model inferensi terbarunya, Qwen2.5-Max, yang memberikan pengembang pemrograman yang kuat dan kemampuan matematika. Peluncuran Qwen2.5-Max menandai terobosan besar lain dalam teknologi kecerdasan buatan di bidang pemrograman dan matematika. Model ini didasarkan pada data pra-pelatihan lebih dari 20 triliun token dan dikombinasikan dengan skema pasca-pelatihan yang dirancang dengan cermat, membawanya ke ketinggian baru dalam kinerja.
Qwen2.5-Max berkinerja sangat baik dalam beberapa tolok ukur. Misalnya, dalam tes seperti Arena-Hard, Livebench, LiveCodebench dan GPQA-Diamond, skor QWEN2.5-MAX melampaui model terkemuka lainnya di industri ini, termasuk Deepseek V3, GPT-4O, dan Claude-3.5-Sonnet. Selain itu, dalam MMLU-Pro dan evaluasi lainnya, QWEN2.5-Max juga menunjukkan hasil yang sangat kompetitif, lebih lanjut membuktikan kemampuannya yang luar biasa dalam tugas-tugas kompleks.

Dalam perbandingan model dasar, QWEN2.5-Max secara komprehensif dibandingkan dengan Deepseek V3, LLAMA-3.1-405B dan QWEN2.5-72B. Hasilnya menunjukkan bahwa model dasar Tongyi Qianwen menunjukkan keunggulan yang signifikan di sebagian besar tolok ukur, terutama ketika berurusan dengan pemrograman yang kompleks dan masalah matematika, Qwen2.5-Max berkinerja sangat baik.
Perlu dicatat bahwa dalam daftar uji buta terbaru dari model-model besar yang dirilis oleh platform uji uji tripartit Chatbot Arena, Qwen2.5-Max melampaui model-model seperti Deepseek-V3, AI O1-Mini dan Claude-3.5-Sonnet, peringkat ketujuh di dunia dengan 1332 poin, menjadi juara non-in-in-in. Dalam hal kemampuan item tunggal seperti matematika dan pemrograman, Qwen2.5-Max menempati peringkat pertama, dan petunjuk keras menempati peringkat kedua. Resmi Chatbot Arena berkomentar bahwa Qwen2.5-Max Alibaba berkinerja kuat di banyak bidang, terutama di bidang profesional dan teknis seperti pemrograman, matematika dan petunjuk keras.
Saat ini, Qwen2.5-Max telah diintegrasikan ke dalam lingcode Tongyi, dan pengguna dapat mengalami kemampuan pemrograman yang kuat dengan mengunduh plug-in Tongyi Lingcode. Integrasi ini tidak hanya memberi pengembang alat yang lebih efisien, tetapi juga membuka kemungkinan baru untuk penerapan teknologi kecerdasan buatan.