홍콩 대학교와 Tencent의 연구팀은 최근 혁신적인 기술 수단을 통해 짧은 비디오 권장 사항의 정확성을 크게 향상시키는 혁신적인 멀티 모달 추천 시스템 인 DIFFMM을 시작했습니다. DIFFMM 시스템은 사용자 및 비디오 정보를 포함하는 복잡한 그래프 구조를 구축하고 그래프 확산 및 비교 학습 기술을 사용하여 사용자와 비디오 간의 대화식 관계를 깊이 분석하여보다 개인화되고 정확한 컨텐츠 권장 사항을 달성합니다.
DIFFMM 시스템의 핵심 기술 프레임 워크는 멀티 모달 그래프 확산 모델, 멀티 모달 그래프 집계 및 교차 모달 대비 향상의 세 부분으로 구성됩니다. 멀티 모달 그래프 확산 모델은 모달 지각 거부 확산 확률 모델을 채택하고, 멀티 모달 정보와 사용자와 항목 사이의 조정 된 신호를 효과적으로 통합하고, 기존의 멀티 모드 권장 시스템에서 부정적인 영향 문제를 해결합니다. 또한, 그래프 확산 최적화 기술을 통해 그래프 확산 패러다임 및 모달 인식을 통해 Diffmm은 모달 인식 생성 및 사용자 항목 맵의 최적화를 실현하여 시스템의 권장 품질을 더욱 향상시킵니다.

교차 모달 대비 향상 측면에서, DIFFMM 시스템은 모달 인식 대비 뷰 및 대비 향상 방법을 도입하여 다른 항목에 대한 사용자 상호 작용 모드의 일관성을 효과적으로 캡처하여 권장 시스템의 전반적인 성능을 크게 향상시킬 수 있습니다. 이 혁신적인 접근 방식은 시스템의 사용자 선호도에 대한 이해를 향상시킬뿐만 아니라 권장 결과의 다양성과 정확성을 향상시킵니다.
연구팀은 논문의 Diffmm 시스템의 설계 원리와 실험 결과에 대해 자세히 설명했다. 이 연구는 멀티 모달 추천 시스템 분야에 대한 새로운 기술 패러다임을 제공 할뿐만 아니라 짧은 비디오 플랫폼의 향후 컨텐츠 권장 사항에 대한 중요한 이론적 지원과 실질적인 지침을 제공합니다.
주요 하이라이트 :
홍콩 대학교와 Tencent가 제안한 새로운 DIFFMM 패러다임은 멀티 모달 권장 시스템의 성능을 크게 향상 시켰습니다.
diffmm 시스템은 그래프 확산 및 비교 학습 기술을 통해 사용자와 비디오 간의 복잡한 관계를 깊이 이해합니다.
cross- 모달 대비 향상 방법의 도입은 권장 시스템의 정확성과 전반적인 성능을 크게 향상시켰다.