คำแนะนำแบบบูรณาการมีวัตถุประสงค์เพื่อแนะนำรายการที่แตกต่างกันในฟีดหลักจากแหล่งต่าง ๆ ผ่านหลายช่องทางซึ่งจำเป็นต้องจับการตั้งค่าของผู้ใช้ทั้งระดับรายการและระดับช่อง มีการใช้กันอย่างแพร่หลายในระบบการปฏิบัติโดยผู้ใช้หลายพันล้านคน
ในงานนี้เราเสนอกรอบการเรียนรู้แบบลำดับชั้นแบบใหม่สำหรับคำแนะนำแบบบูรณาการ (HRL-REC) ซึ่งแบ่งคำแนะนำแบบบูรณาการออกเป็นสองงานเพื่อแนะนำช่องทางและรายการตามลำดับ
เอเจนต์ระดับต่ำเป็นตัวเลือกช่องซึ่งสร้างรายการช่องส่วนตัว ตัวแทนระดับสูงเป็นผู้แนะนำรายการซึ่งแนะนำรายการเฉพาะจากช่องทางต่างกันภายใต้ข้อ จำกัด ของช่อง
HRL-REC ยังได้รับการปรับใช้กับ WeChat Top Stories ซึ่งส่งผลกระทบต่อผู้ใช้หลายล้านคน
ในระบบออนไลน์จริง HRL-REC เป็นกรอบการจัดอันดับที่ซับซ้อนที่นำมาใช้ใน C ++ ทุกรุ่นได้รับการฝึกฝนตามรุ่น Tensorflow แบบกระจายที่ปรับแต่งอย่างลึกซึ้งซึ่งรองรับคุณสมบัติกระจัดกระจายขนาดใหญ่
หากไม่มีข้อมูลขนาดใหญ่และทรัพยากรเครื่องจักรการฝึกอบรม HRL-REC จะไม่สมจริง
ดังนั้นรหัสโอเพ่นซอร์สที่นี่จึงใช้แนวคิดหลักที่ง่ายขึ้นสำหรับการอ้างอิงของนักวิจัยที่สนใจ หากมีข้อผิดพลาดใด ๆ โปรดติดต่อฉัน ขอบคุณ!
"การเรียนรู้การเสริมแรงแบบลำดับชั้นสำหรับคำแนะนำแบบบูรณาการ" (AAAI 2020)