香港大学とテンセント大学の研究チームは最近、革新的なマルチモーダル推奨システムを開始しました。これは、革新的な技術的手段を通じて短いビデオ推奨の精度を大幅に向上させます。 DIFFMMシステムは、ユーザーおよびビデオ情報を含む複雑なグラフ構造を構築し、グラフ拡散と比較学習テクノロジーを使用して、ユーザーとビデオ間のインタラクティブな関係を深く分析し、それにより、よりパーソナライズされた正確なコンテンツの推奨事項を実現します。
DIFFMMシステムのコア技術フレームワークは、マルチモーダルグラフ拡散モデル、マルチモーダルグラフ凝集、クロスモーダルコントラストの強化の3つの部分で構成されています。マルチモーダルグラフ拡散モデルは、モーダル知覚除去拡散確率モデルを採用し、ユーザーとマルチモーダル情報のアイテム間の調整された信号を効果的に統合し、従来のマルチモーダル推奨システムのマイナスの影響の問題を解決します。さらに、グラフ確率拡散パラダイムとモーダル知覚のグラフ拡散最適化テクノロジーを通じて、diffmmはユーザー項目マップのモーダル知覚生成と最適化を実現し、システムの推奨品質をさらに向上させます。

クロスモーダルコントラストの強化の観点から、DIFFMMシステムは、モーダルアウェアのコントラストビューとコントラスト強化方法を導入します。これにより、異なるアイテムでのユーザーインタラクションモードの一貫性を効果的にキャプチャでき、それにより推奨システムの全体的なパフォーマンスが大幅に向上します。この革新的なアプローチは、システムのユーザーの好みに対する理解を高めるだけでなく、推奨される結果の多様性と精度を向上させます。
研究チームは、紙のDiffmmシステムの設計原則と実験結果について詳しく説明しました。この研究は、マルチモーダル推奨システムの分野の新しい技術的パラダイムを提供するだけでなく、短いビデオプラットフォームの将来のコンテンツ推奨に対する重要な理論的サポートと実用的なガイダンスも提供します。
重要なハイライト:
hong香港大学とTencent大学によって提案された新しいDiffmmパラダイムは、マルチモーダル推奨システムのパフォーマンスを大幅に改善しました。
diffmmシステムは、グラフの拡散と比較学習技術を介して、ユーザーとビデオの複雑な関係を深く理解しています。
crossモーダルコントラスト強化方法の導入により、推奨システムの精度と全体的なパフォーマンスが大幅に向上しました。