Webmaster Home รายงาน MathVerse ซึ่งเป็นเกณฑ์มาตรฐานใหม่สำหรับการประเมินโมเดลภาษาขนาดใหญ่หลายรูปแบบ (MLLM) ในการแก้ปัญหาทางคณิตศาสตร์ด้วยภาพ เกณฑ์มาตรฐานนี้ทดสอบประสิทธิภาพของ MLLM หลายรายการในการประมวลผลปัญหาทางคณิตศาสตร์ที่มีข้อมูลภาพ ผลลัพธ์แสดงให้เห็นว่าโมเดลส่วนใหญ่อาศัยอินพุตภาพเป็นอย่างมาก ในขณะที่ GPT-4V ทำงานได้ดีทั้งกับอินพุตข้อความและรูปภาพ งานวิจัยนี้ให้ข้อมูลอ้างอิงที่มีคุณค่าสำหรับการพัฒนา MLLM ในอนาคต และยังกระตุ้นให้นักพัฒนาให้ความสนใจเพิ่มเติมกับความสามารถของโมเดลในการประมวลผลข้อมูลโมดอลต่างๆ
บทความนี้มุ่งเน้นไปที่ผลลัพธ์ของเกณฑ์มาตรฐาน MathVerse โดยเน้นประสิทธิภาพที่ยอดเยี่ยมของ GPT-4V และการพึ่งพาอินพุตภาพส่วนใหญ่ของโมเดลส่วนใหญ่ งานวิจัยนี้มีความสำคัญอย่างยิ่งในการส่งเสริมการพัฒนาโมเดลภาษาขนาดใหญ่หลายรูปแบบ ในอนาคต โมเดลที่มีประสิทธิภาพมากขึ้นจะปรากฏตัวขึ้นเพื่อจัดการกับงานที่ซับซ้อนซึ่งมีข้อมูลภาพได้ดีขึ้น