Kunlun Wanwei مفتوح المصدر Skywork R1V نموذج الاستدلال سلسلة التفكير المرئي - AI مقالات

الكاتب：Eve Cole وقت التحديث：2025-05-22 23:25:01

2025 Binance Direct

أصدرت Kunlun Wanwei مؤخرًا رسميًا أول نموذج استدلال صناعي متعدد الوسائط في العالم Skywork R1V ، يشار إليه باسم "R1V". مع 3.8 مليار معلمة ، يكون النموذج قريبًا من نموذج Deepseek-R1 المعروف المصدر ، وقد حقق أداءً جيدًا في معايير متعددة ، حيث تجتاح سلسلة من التقنيات الحديثة (SOTAS). اختار Kunlun Wanwei Open Source R1V ، بهدف تعزيز تقاسم التكنولوجيا والتقدم وحقن الحيوية الجديدة في مجتمع المصدر العالمي Open Source.

تشتهر R1V بقدرات التفكير المتعددة الوسائط المتميزة ، وهي قادرة على الجمع بين النصوص والمعلومات المرئية بسلاسة لإظهار الذكاء القوي. على وجه التحديد ، يعقد R1V مباشرة النماذج المغلقة المصدر مثل Claude3.5Sonnet و GPT-4O في مهام الأسئلة والجواب المرئي ، وتحافظ على إمكانيات التفكير النصي الأعلى. في معيار MMMU ، سجل R1V سجلًا جديدًا لنماذج من نفس الحجم مع درجة عالية من 69 ، بينما حققت أيضًا علامة 67.5 في اختبار Mathvista ، مما يدل على قدرته القوية في التفكير الرياضي المعقد والتحليل المنطقي.

يرجع نجاح R1V إلى العديد من التقنيات المبتكرة لفريق أبحاث Kunlun Wanwei. من بينها ، يتضمن تعلم النقل عبر الوسائط ، والذي ينقل بشكل فعال إمكانيات التفكير النصية للنماذج الكبيرة إلى أوضاع بصرية ، مما يقلل بشكل كبير من الحاجة إلى بيانات الاستدلال متعددة الوسائط. بالإضافة إلى ذلك ، فإن استراتيجية التدريب الهجينة التي تم تبنيها بواسطة R1V تعمل بشكل ديناميكي على ضبط طول سلاسل التفكير من خلال مزيج من الإشراف التكراري على التعلم الدقيق وتعلم التعزيز ، وبالتالي تحسين كفاءة الاستدلال. تجدر الإشارة إلى أن R1V يقدم أيضًا إطارًا لسلسلة التفكير في سلسلة التفكير التكيفية لتجنب "التفكير" في عملية التفكير ، مما يحسن بشكل كبير من كفاءة ونوعية التفكير.

مع إطلاق R1V ، لم يصبح Kunlun Wanwei أول شركة نموذجية للاستدلال متعدد الوسائط في العالم ، بل اتخذت أيضًا خطوة مهمة في تعزيز تحقيق حلم AGI (الذكاء الاصطناعي العام). يتم نشر جميع الأوزان ورمز الاستدلال والتقارير الفنية للنموذج ، ويمكن لأي شخص الحصول على الموارد ذات الصلة من خلال GitHub واجه وجه.

نموذج تحميل الوزن

وجه المعانقة:

https://huggingface.co/Skywork/skywork-r1v-38b

جيثب:

https://github.com/skyworkai/skywork-r1v

تقرير فني مفصل

https://github.com/skyworkai/skywork-r1v/blob/main/skywork_r1v.pdf

النقاط الرئيسية:

تم إصدار Skywork R1V ، أول نموذج استدلال متعدد الوسائط صناعي مفتوح المصدر في العالم ، رسميًا بمعلمات تصل إلى 3.8 مليار.

كان أداء R1V جيدًا في معايير متعددة ، وخاصة في MMMU و Mathvista مع درجات عالية من 69 و 67.5 على التوالي.

تهدف مبادرة Kunlun Wanwei المفتوحة المصدر إلى تعزيز تقاسم التكنولوجيا ، وحقن الحيوية في مجتمع المصادر المفتوحة العالمية AI ، والمساعدة في حلم Agi.