当前位置: 首页 > news >正文

MGAT: Multimodal Graph Attention Network for Recommendation

模型总览如下:

图1:多模态图注意力网络

背景:本论文是对MMGCN(Wei et al., 2019)的改进。MMGCN简单地在并行交互图上使用GNN,平等地对待从所有邻居传播的信息,无法自适应地捕获用户偏好。

MMGCN的消息聚合方式如下:

     

(平均值聚合

(最大值聚合)

j_{m}:邻居的特征向量

W_{1,m}:可训练的权重矩阵用于提取邻居的有用特征

由公式可见所有邻居都信息都通过W_{1,m}矩阵进行特征提取。当用户分别喜欢物品A的音乐,B的字幕。在音频模态上同等程度的提取B的音频特征,无疑会加入噪声。MGAT对MMGCN针对这点做了改进。

MGAT消息构造如下所示:

  • h:中心节点
  • t:h的邻居节点
  • e_{m,t}:物品t在模态m上的特征表示
  • f_{a}(h,t) : 注意力组件,学习不同邻居的重要性,反映两个节点之间的亲疏关系。

   

      利用Sotfmax函数进行正则化:

    

      其中w_{m,h}以及w_{m,t}是两个可训练矩阵,e_{m,i}为物品i 在模态m上的特征。为了简单起见,论文  中   直接用内积做为注意力分数。

  • f_{g}(h,t)决定项目的每个模态是否将信息传播给目标用户。

(内积门)

(连接门)

(双相互作用门)

其中d为节点h 的邻居的数量。

 三种门的效果对比:

 由实验结果可以发现“最简单”的内积门在两个数据集上的表现都最好,可能原因是其他两个门通过变换矩阵做了特征变换,造成了过拟合。

一层信息融合(h距离一跳的邻居):

 

 e_{m,h}为用户h在模态m上的特征表示,e_{h}为用户h的id特征。物品的不同模态属于不同的语意空间,通过下方的公式将物品所有模态的特征表示都转换到id空间,并在用户的特征表示中加入id属性。上面的公式也是同样的道理,将模态m上从邻居那里得到的信息转换到ID空间,并与自己的特征相结合,得到h在模态m上的最终表示 

高层信息融合

节点h在模态m上汇聚了l跳邻居信息后得到的表征。

节点h的表征为 。

预测:

 

同时融合了各层邻居的信息。

http://www.lryc.cn/news/33250.html

相关文章:

  • 在SNAP中用sentinel-1数据做InSAR测量,以门源地震为例
  • MySQL常用函数
  • 51单片机数字电子钟开题报告
  • day7 HTTP协议
  • 3DCAT+一汽奥迪:共建线上个性化订车实时云渲染方案
  • yii2项目使用frp https2http插件问题
  • 关于 interface{} 会有啥注意事项?下
  • ansible组件介绍和简单playbook测试
  • [数据结构]:13-插入排序(顺序表指针实现形式)(C语言实现)
  • es6 new Promise
  • Python爬虫实战:使用Requests和BeautifulSoup爬取网页内容
  • 质量指标——什么是增量覆盖率?它有啥用途?
  • Hive---拉链表
  • 日常文档标题级别规范
  • C++学习记录——십이 vector
  • Lombok常见用法总结
  • 【Ajax】异步通信
  • 近红外吸收荧光染料IR-808,IR-808 NH2,IR-808 amine,发射808nm 性质分享
  • 一图来看你需要拥有那些知识储备
  • 复位和时钟控制(RCC)
  • OpenWrt 专栏介绍00
  • udk开发-稀里糊涂
  • Java之内部类
  • 【MyBatis】篇二.MyBatis查询与特殊SQL
  • CE认证机构和CE证书的分类
  • Lesson 8.2 CART 分类树的建模流程与 sklearn 评估器参数详解
  • 【Unity】程序集Assembly模块化开发
  • 马尔可夫决策过程
  • win11下载配置CIC Flowmeter环境并提取流量特征
  • JDK如何判断自己是什么公司的