Alibaba Cloud เพิ่งเปิดตัวโมเดลภาพใหม่ของ Tongyi Qianwen Big Model - Qwen2.5 -VL และได้เปิดแหล่งที่มาสามรุ่นที่แตกต่างกันของ 3B, 7B และ 72B การเคลื่อนไหวครั้งนี้นับเป็นความก้าวหน้าที่สำคัญในด้านวิสัยทัศน์ของ AI . QWEN2.5-VL ไม่เพียง แต่มีความสามารถในการทำความเข้าใจภาพที่ทรงพลัง แต่ยังรองรับการทำความเข้าใจวิดีโอมากกว่าหนึ่งชั่วโมง สมัครสมาชิก
Alibaba Cloud Tongyi Qianwen ได้เปิดแหล่งที่มาของรูปแบบการมองเห็นใหม่ QWEN2.5-VL และเปิดตัวสามรุ่นใน 3B, 7B และ 72B
ในหมู่พวกเขาเรือธง QWEN2.5-VL-72B ชนะการแข่งขันชิงแชมป์การทำความเข้าใจด้วยภาพใน 13 บทวิจารณ์ที่มีอำนาจเหนือกว่า GPT-4O และ Claude3.5 Alibaba Cloud แนะนำอย่างเป็นทางการว่า QWEN2.5-VL ใหม่สามารถแยกวิเคราะห์เนื้อหาภาพได้อย่างแม่นยำมากขึ้นและรองรับการทำความเข้าใจวิดีโอมากกว่า 1 ชั่วโมง รุ่นนี้สามารถค้นหาเหตุการณ์เฉพาะในวิดีโอและสรุปประเด็นสำคัญของช่วงเวลาที่แตกต่างกันของวิดีโอดังนั้นจึงช่วยให้ผู้ใช้ดึงข้อมูลคีย์ออกจากวิดีโอได้อย่างรวดเร็วและมีประสิทธิภาพ

นอกจากนี้ QWEN2.5-VL สามารถเปลี่ยนเป็นตัวแทนภาพที่สามารถควบคุมโทรศัพท์มือถือและคอมพิวเตอร์ได้โดยไม่ต้องปรับแต่งการดำเนินการหลายขั้นตอนและการดำเนินงานที่ซับซ้อนเช่นการส่งพรไปยังเพื่อนที่ได้รับมอบหมายการแก้ไขภาพถ่ายคอมพิวเตอร์และตั๋วมือถือ การจองรอ QWEN2.5-VL ไม่เพียง แต่ดีในการระบุวัตถุทั่วไปเช่นดอกไม้นกปลาและแมลง แต่ยังวิเคราะห์ข้อความแผนภูมิไอคอนกราฟิกและเลย์เอาต์ในภาพ Alibaba Cloud ได้ปรับปรุงความสามารถในการจดจำ OCR ของ QWEN2.5-VL และปรับปรุงการจดจำข้อความหลายฉากหลายภาษาและหลายทิศทางและความสามารถในการวางตำแหน่งข้อความ

ในขณะเดียวกันความสามารถในการสกัดข้อมูลได้รับการปรับปรุงอย่างมากเพื่อตอบสนองความต้องการด้านดิจิตอลและอัจฉริยะที่เพิ่มขึ้นของการทบทวนคุณสมบัติการเงินและการพาณิชย์
คะแนน:
Alibaba Cloud Tongyi Qianwen Open Source QWEN2.5-VL เปิดตัวสามเวอร์ชัน 3B, 7B และ 72B
QWEN2.5-VL-72B เหนือกว่า GPT-4O และ Claude3.5 ในการประเมินความเข้าใจด้านภาพ
QWEN2.5-VL สนับสนุนการทำความเข้าใจวิดีโอมากกว่า 1 ชั่วโมงและเพิ่มความสามารถในการรับรู้ OCR
แหล่งโอเพ่นซอร์สของ Qwen2.5-VL จะส่งเสริมการพัฒนาวิสัยทัศน์ AI อย่างมากและนำความเป็นไปได้มากขึ้นสำหรับการใช้งานที่เป็นนวัตกรรมมาสู่ทุกสาขาอาชีพ ประสิทธิภาพที่ทรงพลังและโอกาสในการใช้งานที่กว้างขวางของแอพพลิเคชั่นจะส่งเสริมการพัฒนาต่อไปและความนิยมของเทคโนโลยีปัญญาประดิษฐ์