L'équipe de recherche de l'Université de Hong Kong et Tencent a récemment lancé un système de recommandation multimodal révolutionnaire - Diffmm, qui améliore considérablement la précision des courtes recommandations vidéo par des moyens techniques innovants. Le système Diffmm construit une structure de graphe complexe contenant des informations utilisateur et vidéo, et utilise la technologie d'apprentissage de diffusion et de comparaison des graphiques pour analyser en profondeur la relation interactive entre les utilisateurs et les vidéos, réalisant ainsi des recommandations de contenu plus personnalisées et précises.
Le cadre technique central du système DIFFMM se compose de trois parties: modèle de diffusion de graphes multimodaux, agrégation de graphiques multimodaux et amélioration du contraste transformal. Le modèle de diffusion de graphes multimodaux adopte un modèle modal de probabilité de diffusion du débraillage perceptuel, intègre efficacement les signaux coordonnés entre les utilisateurs et les éléments avec des informations multimodales et résout les problèmes d'impact négatifs dans les systèmes de recommandation multimodaux traditionnels. De plus, grâce à la technologie d'optimisation de la diffusion des graphiques du paradigme de diffusion de probabilité de graphique et de la perception modale, Diffmm réalise la génération de perception modale et l'optimisation des cartes utilisateur-éléments, améliorant davantage la qualité de recommandation du système.

En termes d'amélioration du contraste intermodal, le système DIFFMM introduit la vue de contraste et les méthodes d'amélioration du contraste complémentaire modal, qui peut saisir efficacement la cohérence des modes d'interaction utilisateur sur différents éléments, améliorant ainsi considérablement les performances globales du système de recommandation. Cette approche innovante améliore non seulement la compréhension du système des préférences des utilisateurs, mais améliore également la diversité et la précision des résultats recommandés.
L'équipe de recherche a élaboré en détail les principes de conception et les résultats expérimentaux du système Diffmm dans le document. Cette recherche fournit non seulement un nouveau paradigme technique pour le domaine des systèmes de recommandation multimodaux, mais fournit également un soutien théorique important et des conseils pratiques pour les futures recommandations de contenu des courtes plates-formes vidéo.
Faits saillants clés:
⭐ Le nouveau paradigme Diffmm proposé par l'Université de Hong Kong et Tencent a considérablement amélioré les performances des systèmes de recommandation multimodaux.
⭐ Le système DIFFMM comprend profondément la relation complexe entre les utilisateurs et les vidéos par le biais de techniques de diffusion et d'apprentissage de comparaison des graphiques.
⭐ L'introduction de méthodes d'amélioration du contraste intermodal a considérablement amélioré la précision et les performances globales du système de recommandation.