当前位置: 首页 > news >正文

《图机器学习》-GNN Augmentation and Training

GNN Augmentation and Training

  • 一、Graph Augmentation for GNNs
    • 1、Feature Augmentation
    • 2、Structure augmentation
    • 3、Node Neighborhood Sampling

一、Graph Augmentation for GNNs

之前的假设:
Raw input graph = computational graph,即原始图等于计算图。

现在要打破这个假设,原因如下:

  • 如果图过于稀疏:消息传递效率低下
  • 如果图过于密集了:消息传递的开销太大
    • 如要点击查看某个名人的embedding,要汇聚其成千上万个追随者的信息,这个花销是很大的
  • 如果图很大:难以将计算图拟合到CPU内存中

所以,原始输入图不太可能恰好是嵌入的最佳计算图。因此需要Graph Augmentation,改变解构使之适于嵌入。


1、Feature Augmentation

为什么我们需要特征增强?
(1)、输入图没有节点特征;如只有邻接矩阵的时候。

解决方案:

  1. 为节点分配常量值
    如为每个节点都分配一个常数1,在一轮汇聚后,各节点就能学习到其邻居节点的个数。
    在这里插入图片描述
  2. 为节点分配唯一的IDs
    如为每个节点都分配one-hot编码
    在这里插入图片描述
    该方法每个node的向量不一样,增加了模型的表达能力,但是花费的代价非常大,如one-hot编码的维度和节点数量一致

两种方式的对比:

Constant node featureOne-hot node feature
表达能力中等。所有的节点都是相同的,但GNN仍然可以从图结构中学习高。每个节点都有唯一的ID,因此可以存储特定于节点的信息
归纳学习(推广到新的节点)高。推广到新节点很简单:我们为它们分配恒定的特征,然后应用我们的GNN低。不能泛化到新节点:新节点引入新ID, GNN不知道如何嵌入看不见的ID
计算成本低。只有一维特征高。O(|V|)维度特征,不能应用于大型图
使用范围任何图小图

为什么我们需要特征增强?
(2)、GNN很难学习某些结构

如:计算节点所处环的节点数
在这里插入图片描述

基于前面的GNN是不能够解答这个问题的,原因是这两个节点的计算图是一样的,学习出来的embedding大致类似

在这里插入图片描述
解决方案:
可以添加cycle count作为节点的特征,如下图;即开辟一个特征空间用于描述所需要的属性。
在这里插入图片描述

其他常用于数据增强的特征:

  • Node degree
  • Clustering coefficient
  • PageRank
  • Centrality

2、Structure augmentation

出发点: Augment sparse graphs(增强稀疏图)

  1. Add virtual edges

    • 常见的方法:通过虚边连接2跳邻居
    • 如:将邻接矩阵AAA使用A+A2A+A^2A+A2代替
    • 实例:Bipartite graphs。
      使用2-hop的虚边将作者节点连接起来
      在这里插入图片描述
  2. Add virtual nodes
    增加一个虚拟节点,虚拟节点将于图中的所有节点相连接

    • 好处:
      1. 缩短节点之间的距离(均可两跳可达)
      2. 传递信息更多、更有效、更快
    • 在这里插入图片描述

3、Node Neighborhood Sampling

回顾之前的GNN计算图,所有节点都用于消息传递,如下图:

在这里插入图片描述

新的想法:
随机的选取邻居节点的子集用于计算图的构建(用于信息传递)

例如,可以在给定的层中随机选择2个邻居来传递消息,如下图:

在这里插入图片描述

在大图中,随机采样邻居节点的子集用于信息传递能够减少计算图;但会丢失信息,即获得了效率但失去了一些表现力。

为了弥补,可以在下一层中,当我们计算嵌入时,对不同的邻居进行采样(即每一层都采样不同的邻居用于计算图的构建),提升模型的鲁棒性。

在这里插入图片描述

该方法在实践中效果不错。

http://www.lryc.cn/news/24457.html

相关文章:

  • 【Node.js算法题】数组去重、数组删除元素、数组排序、字符串排序、字符串反向、字符串改大写 、数组改大写、字符替换
  • Win10系统开始菜单无法点击解决方法分享
  • libmodbus从linux访问window上的服务超时问题
  • 挑战图像处理100问(26)——双线性插值
  • NXP iMX8系列处理器Pin Multiplexing定义说明
  • 用Python的Supervisor進行進程監控以及自動啓動
  • Centos和Window系统下Frp内网穿透
  • 春招冲刺(四):flex布局面试题总结
  • 我的 System Verilog 学习记录(7)
  • canvas复习笔记(绘制直线、矩形、圆形、圆弧)
  • LeetCode 653. 两数之和 IV - 输入二叉搜索树
  • 【Datawhale图机器学习】图神经网络
  • 【项目精选】 javaEE采购管理系统(论文+视频+源码)
  • 【Servlet篇2】创建一个web项目
  • Allegro如何手动让静态铜皮避让过孔操作指导
  • Java使用SpringBoot的Filter来扩展管道请求
  • 「JVM 高效并发」锁优化
  • 当园区物流遇上云计算,会发生什么事情?
  • 作为测试开发岗的面试官,我都是怎么选人的?
  • android事件分发机制源码分析
  • 今天,小灰37岁了!
  • 基于.NET 7 + iView 的前后端分离的通用后台管理系统开源框架
  • 新一代通信协议—— RSocket
  • 【编程实践】这个代码命名规范是真优雅呀!代码如诗!!(多读优秀的开源代码,多实践,你也可以一样优秀!)
  • Linux->进程终止和等待
  • 超店有数分享:tiktok数据分析工具推荐,助你成功出海!
  • 2022 第十四届蓝桥杯模拟赛第三期(题解与标程)
  • 「TCG 规范解读」PC 平台相关规范(1)
  • HNU工训中心:直流电路测量分析实验报告
  • tensorflow2.4--1.框架介绍