HRL Rec
1.0.0
綜合建議旨在通過多個渠道從不同來源的主要供稿中共同推薦異質項目,這需要在項目和頻道級別上捕獲用戶偏好。數十億用戶已廣泛用於實踐系統中,而很少有工作集中在系統上的集成推薦上。
在這項工作中,我們提出了一個新穎的層次增強學習框架(HRL-REC),該框架將集成的建議分為兩個任務,以依次推薦渠道和項目。
低級代理是頻道選擇器,它生成個性化的頻道列表。高級代理是一個推薦的項目,該項目在頻道約束下推薦了來自異質通道的特定項目。
HRL-REC也已被部署在微信中的故事中,影響了數百萬用戶。
在實際的在線系統中,HRL-REC是C ++實現的複雜重新排列框架。所有型號均基於分佈式Tensorflow的深層定製版本培訓,並支持大規模稀疏功能。
沒有大量數據和機器資源,培訓HRL-REC是不現實的。
因此,這裡的開源代碼僅實現其核心思想的簡化版本,以參考感興趣的研究人員。如果有任何錯誤,請與我聯繫。謝謝!
“集成推薦的分層增強學習”(AAAI 2020)