当前位置: 首页 > news >正文

Sub - Adjacent Transformer — 对AT的有趣改进

出处:IJCAI 2024 未开源,链接貌似是:jackyue1994/Sub-Adjacent-Transformer (github.com)

贡献:1. 提出:基于 “次邻域” 及 “注意力贡献” 的注意力学习机制,以增强异常、正常的区分;2. 首次将 “线性注意力” 及 “可学习的映射函数” 引入TSAD。

1. 基本思想

Time points usually have stronger connections with their neighbors and fewer connections with distant points. This characteristic is more pronounced for anomalies [Xu et al., 2022].    →    

If we rely solely on subadjacent neighborhoods to reconstruct time points, the reconstruction errors of anomalies will become more pronounced, thereby enhancing their distinguishability.

2. 具体方法

the sub-adjacent neighborhoods (“次邻域” ) 概念:

直观理解:图(b)内的 𝐾2 - 𝐾1 区域;𝐾1𝐾2 预定义的区域边界,满足:𝐾2 ≥ 𝐾1 > 0.

具体概念:The sub-adjacent neighborhoods indicate the areas not immediately adjacent to the target point.

𝐾1𝐾2 预定义的区域边界,满足:𝐾2 ≥ 𝐾1 > 0. win_size 是划分的时序窗口大小. 红色部分代表 the sub-adjacent neighborhoods

the sub-adjacent attention (“注意力贡献”) 概念:

1. * 注意力贡献 (attention contribution):在同一窗口内,将注意力矩阵的 “列” 视为:各点对其他点的贡献;

2. 计算:每列各点的 the sub-adjacent attention:

直观理解:图 2 内虚线区域之和. 

具体概念:The sub-adjacent attention contribution is defined as the sum of particular non-diagonal elements in the corresponding column of the attention matrix.

3. 计算:整个窗口内,每列各点的 the sub-adjacent attention之和:

4. 实际的细节问题:如果目标点靠近的窗口起点或终点,次邻域范围可能部分超出窗口,因此可用的点数量会变少,造成贡献不均,不平衡:(蓝色阴影部分)

解决方法: 

循环移位函数(circular shift function),通过对时间点进行循环移位,确保边界点能够公平地参与注意力贡献计算,即每个点的次邻域内始终有相同数量的时间点:

线性注意力: 

损失函数 和 异常分数:

1. 损失函数:在损失函数中,引入“次相邻” 的注意贡献,引导模型关注 “次相邻” 的邻域:

2.  异常分数:

3. Dynamic Gaussian Scoring:

3. 实验结果

http://www.lryc.cn/news/461313.html

相关文章:

  • 『Mysql集群』Mysql高可用集群之主从复制 (一)
  • PHP获取图片属性(size, width, 和 height)的函数
  • MySQL启动失败解决方案
  • Spring Boot中使用MyBatis-Plus和MyBatis拦截器来实现对带有特定注解的字段进行AES加密。
  • Python GUI 编程:tkinter 初学者入门指南——框架、标签框架
  • Mac 远程 Windows 等桌面操作系统工具 Microsoft Remote Desktop for Mac 下载安装详细使用教程
  • 初级网络工程师之从入门到入狱(四)
  • MinIO配置与使用
  • 【漏洞复现】SpringBlade menu/list SQL注入漏洞
  • 物联网智能项目(含案例说明)
  • 【YOLOv8改进】 YOLOv8 更换骨干网络之GhostNetV3步骤详解
  • 成绩查询小程序,家长查分超方便~
  • 鸿蒙开发(NEXT/API 12)【上传下载文件】远场通信场景
  • 快速理解AUTOSAR CP的软件架构层次以及各层的作用
  • 【Unity】Unity中接入Admob聚合广告平台,可通过中介接入 AppLovin,Unity Ads,Meta等渠道的广告
  • PythonExcel批量pingIP地址
  • 软媒市场新蓝海:软文媒体自助发布与自助发稿的崛起
  • 【笔记】Day2.5.1查询运费模板列表(未完
  • 阿基米德螺旋线等距取点
  • 2024年全球增强现实(AR)市场分析报告
  • 探索 NetworkX:Python中的网络分析利器
  • Python知识点:基于Python技术,如何使用AirSim进行无人机模拟
  • 《中国林业产业》是什么级别的期刊?是正规期刊吗?能评职称吗?
  • 私域流量下的白酒新传奇:半年破五千万的营销策略揭秘
  • Tomcat 配置:方便运行 Java Web 项目
  • Spring Boot知识管理:机器学习与AI集成
  • Superset SQL模板使用
  • 算法工程师重生之第二十七天(合并区间 单调递增的数字 监控二叉树 总结)
  • 前端开发基础NodeJS+NPM基本使用(零基础入门)
  • 深度学习 nd.random.normal()