当前位置：首页 > news >正文

MGAT: Multimodal Graph Attention Network for Recommendation

news 2025/7/7 3:18:45

模型总览如下：

图1：多模态图注意力网络

背景：本论文是对MMGCN（Wei et al., 2019）的改进。MMGCN简单地在并行交互图上使用GNN，平等地对待从所有邻居传播的信息，无法自适应地捕获用户偏好。

MMGCN的消息聚合方式如下：

（平均值聚合

或

（最大值聚合）

$j_{m}$ ：邻居的特征向量

$W_{1,m}$ ：可训练的权重矩阵用于提取邻居的有用特征

由公式可见所有邻居都信息都通过 $W_{1,m}$ 矩阵进行特征提取。当用户分别喜欢物品A的音乐，B的字幕。在音频模态上同等程度的提取B的音频特征，无疑会加入噪声。MGAT对MMGCN针对这点做了改进。

MGAT消息构造如下所示：

h：中心节点
t：h的邻居节点
$e_{m,t}$ ：物品t在模态m上的特征表示
$f_{a}(h,t)$ ：注意力组件，学习不同邻居的重要性，反映两个节点之间的亲疏关系。

利用Sotfmax函数进行正则化：

其中 $w_{m,h}$ 以及 $w_{m,t}$ 是两个可训练矩阵， $e_{m,i}$ 为物品i 在模态m上的特征。为了简单起见，论文中直接用内积做为注意力分数。

$f_{g}(h,t)$ 决定项目的每个模态是否将信息传播给目标用户。

（内积门）

（连接门）

（双相互作用门）

其中d为节点h 的邻居的数量。

三种门的效果对比：

由实验结果可以发现“最简单”的内积门在两个数据集上的表现都最好，可能原因是其他两个门通过变换矩阵做了特征变换，造成了过拟合。

一层信息融合(h距离一跳的邻居)：

$e_{m,h}$ 为用户h在模态m上的特征表示， $e_{h}$ 为用户h的id特征。物品的不同模态属于不同的语意空间，通过下方的公式将物品所有模态的特征表示都转换到id空间，并在用户的特征表示中加入id属性。上面的公式也是同样的道理，将模态m上从邻居那里得到的信息转换到ID空间，并与自己的特征相结合，得到h在模态m上的最终表示

高层信息融合

节点h在模态m上汇聚了l跳邻居信息后得到的表征。

节点h的表征为。

预测：

同时融合了各层邻居的信息。

http://www.lryc.cn/news/33250.html

相关文章：

在SNAP中用sentinel-1数据做InSAR测量，以门源地震为例

MySQL常用函数

51单片机数字电子钟开题报告

day7 HTTP协议

3DCAT+一汽奥迪：共建线上个性化订车实时云渲染方案

yii2项目使用frp https2http插件问题

关于 interface{} 会有啥注意事项？下

ansible组件介绍和简单playbook测试

[数据结构]：13-插入排序（顺序表指针实现形式）（C语言实现）

es6 new Promise

Python爬虫实战：使用Requests和BeautifulSoup爬取网页内容

质量指标——什么是增量覆盖率？它有啥用途？

Hive---拉链表

日常文档标题级别规范

C++学习记录——십이 vector

Lombok常见用法总结

【Ajax】异步通信

近红外吸收荧光染料IR-808，IR-808 NH2，IR-808 amine，发射808nm 性质分享

一图来看你需要拥有那些知识储备

复位和时钟控制（RCC）

OpenWrt 专栏介绍00

udk开发-稀里糊涂

Java之内部类

【MyBatis】篇二.MyBatis查询与特殊SQL

CE认证机构和CE证书的分类

Lesson 8.2 CART 分类树的建模流程与 sklearn 评估器参数详解

【Unity】程序集Assembly模块化开发

马尔可夫决策过程

win11下载配置CIC Flowmeter环境并提取流量特征

JDK如何判断自己是什么公司的