تهدف التوصية المتكاملة إلى التوصية بشكل مشترك عن عناصر غير متجانسة في التغذية الرئيسية من مصادر مختلفة عبر قنوات متعددة ، والتي تحتاج إلى التقاط تفضيلات المستخدم على كل من مستويات العنصر والقناة. تم استخدامه على نطاق واسع في الأنظمة العملية من قبل مليارات المستخدمين ، في حين أن القليل من الأعمال تركز على التوصية المتكاملة بشكل منهجي.
في هذا العمل ، نقترح إطارًا جديدًا لتعلم التعزيز الهرمي للتوصية المتكاملة (HRL-REC) ، والذي يقسم التوصية المتكاملة إلى مهمتين للتوصية بالقنوات والعناصر بشكل متتابع.
الوكيل ذي المستوى المنخفض هو محدد للقناة ، والذي يولد قائمة قناة مخصصة. العامل ذو المستوى العالي هو عنصر موصى به ، يوصي عناصر محددة من القنوات غير المتجانسة تحت قيود القناة.
تم نشر HRL-REC أيضًا على قصص WeChat Top ، مما يؤثر على ملايين المستخدمين.
في النظام الفعلي عبر الإنترنت ، يعد HRL-REC إطارًا معقدًا لإعادة الطبقة التي تم تنفيذها في C ++. يتم تدريب جميع الطرز على أساس نسخة مخصصة للغاية من TensorFlow الموزع لدعم ميزات متفرق على نطاق واسع.
بدون موارد البيانات والآلات الضخمة ، فإن تدريب HRL-REC ليس واقعيًا.
لذلك ، لا ينفذ رمز المصدر المفتوح هنا سوى نسخة مبسطة من أفكارها الأساسية للرجوع إلى الباحثين المهتمين. إذا كانت هناك أي أخطاء ، يرجى الاتصال بي. شكرًا!
"تعلم التعزيز الهرمي للتوصية المتكاملة" (AAAI 2020)