当前位置: 首页 > news >正文

机器学习笔记:node2vec(论文笔记:node2vec: Scalable Feature Learning for Networks)

2016 KDD

1 intro

  • 利用graph上的节点相似性,对这些节点进行embedding
    • 同质性:节点和其周围节点的embedding比较相似
      • 蓝色节点和其周围的节点
    • 结构等价性
      • 结构相近的点embedding相近
        • 比如蓝色节点,都处于多个簇的连接处

2 随机游走

2.1 介绍

  • 随机游走是一种自监督学习的embedding方法,不需要利用节点标签也不需要节点的特征,训练出来的embedding也不依赖于任何的特定任务
  • 首先随机选择一个邻居节点,走到该处再随机选择一个邻居,重复length次
    • length是指随机游走的长度
    • 使用随机游走从起始节点到终止节点的概率值,实际上就可以用来表示相似度
      • 也就是说,从u到v节点的概率值,应该正比于u与v节点embedding之后的点乘结果
      • z_v^TZ_u \propto P(v|u)

2.2 具体算法

  • 根据某种策略R,从图上的每个点,执行一些随机游走
  • 对图上的每个点u,收集相对应的点集N_R(u)
    • N_R(u)是从u点出来的各条随机游走路径上的点集
    • N_R(u)中可能会有重复的元素 
  • 根据对数概率,优化embedding
    • 目标:最小化损失函数L
      • ——>最大化在N_R(u)中的v与u之间的log(P(v|Zu))
      • ——>最大化在u随机游走路径上的v与u之间的P(v|Zu)
        ——>在u随机游走路径上的v,尽量地和u相似(Z_u^TZ_v)

2.3 随机游走策略

  • 最简单的策略:从每个点跑固定长度,没有bias的随机游走
    • 会导致游走局部化或者仅在个别点之间游走
    • ——>提出两个参数(概率)用来控制游走策略

  • 从w(t时刻)到s1(t+1时刻)

    • t+1时刻和t-1时刻的距离为0——return parameter

  • 从w(t时刻)到s2(t+1时刻)

    • t+1时刻和t-1时刻的距离为1

  • 从w(t时刻)到s3(t+1时刻)

    • t+1时刻和t-1时刻的距离为2——>walk away parameter

2.3.1 一次游走,多个节点游走路径

在寻找随机游走的过程中,我们可以通过一次游走(深度优先遍历的算法,路径长),寻找出多个节点的游走路径(路径短)

2.3.2 p,q对路径搜索的影响

  • DFS,深度优先,即q值小,探索强。会捕获同质性节点,即相邻节点表示类似。
  • BFS,广度优先,即p值小,保守周围。会捕获结构性,即某些节点的图上结构类类似。

2.3.3 随机游走算法优化

上述算法有一个问题,就是我计算P(v|Zu)时,分母还是需要每一对node 都计算一边,那么还是O(|V|^2)的时间复杂度

解决方法:负采样

  •   分母改为随机采样k个点
    • 每个点负采样概率正比于这个点的度数

3 用点embedding 表示边embedding

通过平均、哈达玛积(元素相乘)、L1、L2计算方式表示边的embedding

4 实验结果

 

http://www.lryc.cn/news/161363.html

相关文章:

  • go基础10 -字符串的高效构造与转换
  • VR钢铁实训 | 铁前事业部虚拟仿真培训软件
  • DevOps
  • IJ中PHP环境的搭建和使用教程
  • java开发之个人微信的二次开发
  • ISYSTEM调试实践11-Profiler Timeline和软件运行时间分析
  • 第十八章 ObjectScript - 使用例程
  • Linux中select poll和epoll的区别
  • 新知同享|Cloud 开发加速创新,更加安全
  • el-form内容重置(解决点击保存关闭后再点击新增会有编辑携带的数据的问题)
  • 怎样吃透一个java项目?
  • linux 网络命令
  • QUIC协议科普导入(一)
  • matlab 矩阵逆运算的条件数
  • [构建自己的 Vue 组件库] 小尾巴 UI 组件库
  • 由于电脑出现msvcr110.dll提示错误的解决方法
  • [LINUX使用] iptables tcpdump wireshark tshark
  • 显示器鼠标滚动时或者拖拽文字变为绿色
  • 高校网络安全体系建设及零信任安全架构应用的探索
  • Android Studio设置
  • 【RabbitMQ】介绍及消息收发流程
  • 如何预防最新的Mallox变种malloxx勒索病毒感染您的计算机?
  • 软件测试中的43个功能测试点总结
  • Flutter 通过BottomSheetDialog实现抖音打开评论区,内容自动上推、缩放效果
  • Python读取TCP的4字节浮点数
  • javaee springMVC的简单使用 jsp页面在webapp和web-inf目录下的区别
  • Docker容器技术实战-1
  • LeetCode算法题:2. 两数相加
  • ResNet 09
  • 什么是脚本语言,解释脚本语言的特点和应用领域