أطلق فريق الأبحاث من جامعة هونغ كونغ وتنسنت مؤخرًا نظام توصية متعددة الوسائط ثوري - DIFFMM ، والذي يحسن بشكل كبير من دقة توصيات الفيديو القصيرة من خلال الوسائل التقنية المبتكرة. يقوم نظام DIFFMM بإنشاء بنية رسم بياني معقدة تحتوي على معلومات المستخدم والفيديو ، ويستخدم انتشار الرسم البياني ومقارنة تقنية التعلم لتحليل العلاقة التفاعلية بين المستخدمين ومقاطع الفيديو ، وبالتالي تحقيق توصيات محتوى أكثر تخصيصًا ودقيقة.
يتكون الإطار الفني الأساسي لنظام DIFFMM من ثلاثة أجزاء: نموذج نشر الرسم البياني متعدد الوسائط ، وتجميع الرسم البياني متعدد الوسائط ، وتعزيز التباين عبر الوسائط. يتبنى نموذج نشر الرسم البياني متعدد الوسائط نموذج احتمال انتشار النقل الحسي ، ويدمج بشكل فعال الإشارات المنسقة بين المستخدمين والعناصر ذات المعلومات المتعددة الوسائط ، ويحل مشاكل التأثير السلبي في أنظمة التوصية المتعددة الوسائط التقليدية. بالإضافة إلى ذلك ، من خلال تقنية تحسين انتشار الرسم البياني لنموذج انتشار احتمال الرسم البياني وإدراك مشروط ، يدرك DIFFMM توليد الإدراك الوسيط وتحسين خرائط عنصر المستخدم ، مما يزيد من جودة توصية النظام.

من حيث تعزيز التباين عبر الوسائط ، يقدم نظام DIFFMM طريقة عرض التباين المعيارية وطرق تحسين التباين ، والتي يمكن أن تلتقط بشكل فعال تناسق أوضاع تفاعل المستخدم على عناصر مختلفة ، وبالتالي تحسين الأداء الكلي لنظام التوصية. لا يعزز هذا النهج المبتكر فهم النظام لتفضيلات المستخدم فحسب ، بل يعمل أيضًا على تحسين تنوع ودقة النتائج الموصى بها.
قام فريق البحث بالتفصيل حول مبادئ التصميم والنتائج التجريبية لنظام DiffMM في الورقة. لا يوفر هذا البحث نموذجًا تقنيًا جديدًا فقط لمجال أنظمة التوصيات متعددة الوسائط ، ولكنه يوفر أيضًا دعمًا نظريًا مهمًا وتوجيهًا عمليًا لتوصيات المحتوى المستقبلي لمنصات الفيديو القصيرة.
أبرز الأحداث الرئيسية:
⭐ نموذج DIFFMM الجديد الذي اقترحته جامعة هونغ كونغ و Tencent قد حسّن بشكل كبير أداء أنظمة التوصية متعددة الوسائط.
⭐ نظام DIFFMM يفهم بعمق العلاقة المعقدة بين المستخدمين ومقاطع الفيديو من خلال نشر الرسم البياني وتقنيات التعلم المقارنة.
⭐ أدى إدخال طرق تعزيز التباين عبر الوسائط إلى تحسين دقة نظام التوصية والأداء العام.