เมื่อวันที่ 3 มีนาคม 2568 Tongyi Lingma เปิดตัวโมเดลการอนุมานล่าสุดอย่างเป็นทางการ QWEN2.5-MAX ซึ่งให้นักพัฒนาซอฟต์แวร์ด้วยการเขียนโปรแกรมที่มีประสิทธิภาพและความสามารถทางคณิตศาสตร์ การเปิดตัว QWEN2.5-MAX นับเป็นความก้าวหน้าครั้งสำคัญอีกประการหนึ่งในเทคโนโลยีปัญญาประดิษฐ์ในสาขาการเขียนโปรแกรมและคณิตศาสตร์ โมเดลนี้ใช้ข้อมูลก่อนการฝึกอบรมของโทเค็นมากกว่า 20 ล้านล้านโทและรวมกับรูปแบบการฝึกอบรมหลังการฝึกอบรมอย่างระมัดระวังนำไปสู่ความสูงใหม่ในประสิทธิภาพ
QWEN2.5-MAX ทำงานได้ดีเป็นพิเศษในการเปรียบเทียบหลายประการ ตัวอย่างเช่นในการทดสอบเช่น Arena-Hard, LiveBench, LiveCodeBench และ GPQA-Diamond, Qwen2.5-Max คะแนนเหนือกว่ารุ่นชั้นนำอื่น ๆ ในอุตสาหกรรมรวมถึง Deepseek V3, GPT-4O และ Claude-3.5-Sonnet นอกจากนี้ใน MMLU-PRO และการประเมินอื่น ๆ QWEN2.5-MAX ยังแสดงให้เห็นถึงผลลัพธ์ที่มีการแข่งขันสูงซึ่งพิสูจน์ความสามารถที่โดดเด่นในงานที่ซับซ้อน

ในการเปรียบเทียบโมเดลพื้นฐาน QWEN2.5-MAX ถูกเปรียบเทียบอย่างละเอียดกับ Deepseek V3, LLAMA-3.1-405B และ QWEN2.5-72B ผลการวิจัยพบว่าแบบจำลองพื้นฐานของ Tongyi Qianwen แสดงให้เห็นถึงข้อได้เปรียบที่สำคัญในมาตรฐานส่วนใหญ่โดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับการเขียนโปรแกรมที่ซับซ้อนและปัญหาทางคณิตศาสตร์ QWEN2.5-MAX ทำงานได้ดีเป็นพิเศษ
เป็นที่น่าสังเกตว่าในรายการทดสอบคนตาบอดล่าสุดของรุ่นขนาดใหญ่ที่ออกโดยแพลตฟอร์มการทดสอบเกณฑ์มาตรฐานไตรภาคี Chatbot Arena, Qwen2.5-Max ที่เหนือกว่าเช่น Deepseek-V3, เปิด AI O1-Mini และ Claude-3.5-sonnet ในแง่ของความสามารถในรายการเดี่ยวเช่นคณิตศาสตร์และการเขียนโปรแกรม QWEN2.5-MAX อันดับแรกและ Hard Prompts อันดับที่สอง Chatbot Arena อย่างเป็นทางการให้ความเห็นว่า Qwen2.5-Max ของอาลีบาบาดำเนินการอย่างมากในหลายสาขาโดยเฉพาะอย่างยิ่งในสาขาวิชาชีพและด้านเทคนิคเช่นการเขียนโปรแกรมคณิตศาสตร์และการแจ้งเตือนอย่างหนัก
ในปัจจุบัน QWEN2.5-MAX ได้ถูกรวมเข้ากับ Tongyi LingCode และผู้ใช้สามารถสัมผัสกับความสามารถในการเขียนโปรแกรมที่ทรงพลังโดยการดาวน์โหลดปลั๊กอิน Lingyi Lingcode การรวมนี้ไม่เพียง แต่ให้เครื่องมือที่มีประสิทธิภาพมากขึ้นนักพัฒนา แต่ยังเปิดโอกาสใหม่สำหรับการประยุกต์ใช้เทคโนโลยีปัญญาประดิษฐ์