El equipo de investigación de la Universidad de Hong Kong y Tencent lanzó recientemente un sistema revolucionario de recomendación multimodal: Diffmm, que mejora significativamente la precisión de las recomendaciones de video cortas a través de medios técnicos innovadores. El sistema Diffmm construye una estructura gráfica compleja que contiene información de usuarios y video, y utiliza la tecnología de aprendizaje de difusión y comparación gráfica para analizar profundamente la relación interactiva entre usuarios y videos, logrando así recomendaciones de contenido más personalizadas y precisas.
El marco técnico central del sistema DIFFMM consta de tres partes: modelo de difusión de gráficos multimodales, agregación de gráficos multimodales y mejora de contraste intermodal. El modelo de difusión de gráficos multimodal adopta un modelo de probabilidad de difusión perceptual modal de difusión, integra efectivamente las señales coordinadas entre usuarios y elementos con información multimodal, y resuelve los problemas de impacto negativo en los sistemas de recomendación multimodal tradicionales. Además, a través de la tecnología de optimización de difusión gráfica del paradigma de difusión de probabilidad gráfica y la percepción modal, Diffmm realiza la generación de percepción modal y la optimización de los mapas de elementos de usuario, mejorando aún más la calidad de recomendación del sistema.

En términos de mejora de contraste intermodal, el sistema DIFFMM introduce métodos de mejora de contraste y contraste consciente de modales, lo que puede capturar efectivamente la consistencia de los modos de interacción del usuario en diferentes elementos, mejorando significativamente el rendimiento general del sistema de recomendación. Este enfoque innovador no solo mejora la comprensión del sistema de las preferencias del usuario, sino que también mejora la diversidad y la precisión de los resultados recomendados.
El equipo de investigación elaboró en detalle los principios de diseño y los resultados experimentales del sistema Diffmm en el documento. Esta investigación no solo proporciona un nuevo paradigma técnico para el campo de los sistemas de recomendación multimodal, sino que también proporciona un soporte teórico importante y una orientación práctica para futuras recomendaciones de contenido de plataformas de video cortas.
Destacados clave:
⭐ El nuevo paradigma de Diffmm propuesto por la Universidad de Hong Kong y Tencent ha mejorado significativamente el rendimiento de los sistemas de recomendación multimodal.
⭐ El sistema DIFFMM entiende profundamente la compleja relación entre usuarios y videos a través de técnicas de difusión y aprendizaje de comparación gráfica.
⭐ La introducción de métodos de mejora de contraste intermodal ha mejorado en gran medida la precisión y el rendimiento general del sistema de recomendación.