أصدرت Kunlun Wanwei مؤخرًا رسميًا أول نموذج استدلال صناعي متعدد الوسائط في العالم Skywork R1V ، يشار إليه باسم "R1V". مع 3.8 مليار معلمة ، يكون النموذج قريبًا من نموذج Deepseek-R1 المعروف المصدر ، وقد حقق أداءً جيدًا في معايير متعددة ، حيث تجتاح سلسلة من التقنيات الحديثة (SOTAS). اختار Kunlun Wanwei Open Source R1V ، بهدف تعزيز تقاسم التكنولوجيا والتقدم وحقن الحيوية الجديدة في مجتمع المصدر العالمي Open Source.

تشتهر R1V بقدرات التفكير المتعددة الوسائط المتميزة ، وهي قادرة على الجمع بين النصوص والمعلومات المرئية بسلاسة لإظهار الذكاء القوي. على وجه التحديد ، يعقد R1V مباشرة النماذج المغلقة المصدر مثل Claude3.5Sonnet و GPT-4O في مهام الأسئلة والجواب المرئي ، وتحافظ على إمكانيات التفكير النصي الأعلى. في معيار MMMU ، سجل R1V سجلًا جديدًا لنماذج من نفس الحجم مع درجة عالية من 69 ، بينما حققت أيضًا علامة 67.5 في اختبار Mathvista ، مما يدل على قدرته القوية في التفكير الرياضي المعقد والتحليل المنطقي.
يرجع نجاح R1V إلى العديد من التقنيات المبتكرة لفريق أبحاث Kunlun Wanwei. من بينها ، يتضمن تعلم النقل عبر الوسائط ، والذي ينقل بشكل فعال إمكانيات التفكير النصية للنماذج الكبيرة إلى أوضاع بصرية ، مما يقلل بشكل كبير من الحاجة إلى بيانات الاستدلال متعددة الوسائط. بالإضافة إلى ذلك ، فإن استراتيجية التدريب الهجينة التي تم تبنيها بواسطة R1V تعمل بشكل ديناميكي على ضبط طول سلاسل التفكير من خلال مزيج من الإشراف التكراري على التعلم الدقيق وتعلم التعزيز ، وبالتالي تحسين كفاءة الاستدلال. تجدر الإشارة إلى أن R1V يقدم أيضًا إطارًا لسلسلة التفكير في سلسلة التفكير التكيفية لتجنب "التفكير" في عملية التفكير ، مما يحسن بشكل كبير من كفاءة ونوعية التفكير.
مع إطلاق R1V ، لم يصبح Kunlun Wanwei أول شركة نموذجية للاستدلال متعدد الوسائط في العالم ، بل اتخذت أيضًا خطوة مهمة في تعزيز تحقيق حلم AGI (الذكاء الاصطناعي العام). يتم نشر جميع الأوزان ورمز الاستدلال والتقارير الفنية للنموذج ، ويمكن لأي شخص الحصول على الموارد ذات الصلة من خلال GitHub واجه وجه.
نموذج تحميل الوزن
وجه المعانقة:
https://huggingface.co/Skywork/skywork-r1v-38b
جيثب:
https://github.com/skyworkai/skywork-r1v
تقرير فني مفصل
https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf
النقاط الرئيسية:
تم إصدار Skywork R1V ، أول نموذج استدلال متعدد الوسائط صناعي مفتوح المصدر في العالم ، رسميًا بمعلمات تصل إلى 3.8 مليار.
كان أداء R1V جيدًا في معايير متعددة ، وخاصة في MMMU و Mathvista مع درجات عالية من 69 و 67.5 على التوالي.
تهدف مبادرة Kunlun Wanwei المفتوحة المصدر إلى تعزيز تقاسم التكنولوجيا ، وحقن الحيوية في مجتمع المصادر المفتوحة العالمية AI ، والمساعدة في حلم Agi.