当前位置: 首页 > news >正文

多线程环境下的伪共享

今天和大家聊一聊伪共享

1.什么是伪共享?

缓存一致性协议在计算机中针对的最小单元:缓存行,每个缓存行的大小是64字节,一串连续的64字节数据都会存储到缓存行中。

  • 假设数据A和数据B在同一缓存行中,CPU1修改了数据A,根据缓存一致性协议,CPU1会通知其他CPU这一行的缓存数据已经失效。此时CPU2想要修改数据B,但是缓存行已经失效了,所以需要重新从主内存中读取数据,然后重新写会缓存行中。这样缓存的优势就完全没有了。
  • 上述问题就是伪共享的场景,如果同时有多个CPU同时修改同一缓存行的数据,频繁回写主内存,会大大降低性能。
    如下图所示:
    在这里插入图片描述
    在这里插入图片描述

2.如何解决伪共享问题?

  • 伪共享的根源就是不同的数据缓存到了同一缓存行中,如果我们能把独立的数据都单独存储到不同的缓存行,那么伪共享的问题也就不存在了。
  • 缓存行填充:
    当我们存储的数据不足64字节的时候,我们可以手动将余下的字节空间填充,以空间换时间的方式,解决伪共享。
    举个例子:
public class FalseShareTest  {public static void main(String[] args) throws InterruptedException {Rectangle rectangle = new Rectangle();long beginTime = System.currentTimeMillis();Thread thread1 = new Thread(() -> {for (int i = 0; i < 100000000; i++) {rectangle.a = rectangle.a + 1;}});Thread thread2 = new Thread(() -> {for (int i = 0; i < 100000000; i++) {rectangle.b = rectangle.b + 1;}});thread1.start();thread2.start();thread1.join();thread2.join();System.out.println("执行时间" + (System.currentTimeMillis() - beginTime));}
}class Rectangle {volatile long a;volatile long b;
}
//运行结果:
执行时间2815

一个long类型是8字节,我们在变量a和b之间不上7个long类型变量呢,输出结果是啥呢?如下:

class Rectangle {volatile long a;long a1,a2,a3,a4,a5,a6,a7;volatile long b;
}
//运行结果
执行时间1113

我们可以发现,利用填充数据的方式,可以让读写的变量分割到不同缓存行中,性能可以大大提高!

3.消除伪共享的框架应用

Disruptor是一个性能极强的开源的无锁并发框架,基于Disruptor的LMAX架构交易平台,号称单线程内每秒可处理600万笔订单。简直是一个不折不扣的性能小钢炮。
Disruptor框架的核心是它的Ringbuffer环形缓冲。这里不做框架的具体分析,有兴趣可在github下载源码。推荐大家阅读Disruptor框架。
在这里插入图片描述
在Disruptor中,也是应用了大量的缓存行填充,消除了伪共享的问题。

http://www.lryc.cn/news/447.html

相关文章:

  • 【Taylor and Francis】1/2区云计算、物联网、机器学习类,SCIEEI双检,审稿友好
  • CleanMyMac X4.12新版本下载及功能介绍
  • 大数据技术架构(组件)26——Spark:Shuffle
  • 关于Zebec生态的改进提案,即将上线的 Nautilus 链
  • Python数据可视化(三)(pyecharts)
  • 【Redis面试指南】
  • 大数据技术之Hadoop(生产调优手册)
  • 「Vue源码学习」常见的 Vue 源码面试题,看完可以说 “精通Vue” 了吗?
  • FreeModbus RTU 移植指南
  • 《唐诗三百首》数据源网络下载
  • (深度学习快速入门)第五章第一节2:GAN经典案例之MNIST手写数字生成
  • 雁过留痕,竟是病毒的痕迹?
  • Linux基本功系列之sort命令实战
  • 【笔记】移动端自动化:adb调试工具+appium+UIAutomatorViewer
  • 面试复习题--性能检测原理
  • @LoadBalanced 和 @RefreshScope 同时使用,负载均衡失效分析
  • 2023年个人计划
  • 加拿大访问学者家属如何办理探亲签证?
  • 操作系统基础---多线程
  • 2022-12-10青少年软件编程(C语言)等级考试试卷(六级)解析
  • 太酷了,用Python实现一个动态条形图!
  • 单元测试junit+mock
  • 2022Q4手机银行新版本聚焦提升客群专属、财富开放平台、智能化能力,活跃用户规模6.91亿人
  • YOLO-V1~V3经典物体检测算法介绍
  • SparkSQL 核心编程
  • Android核心开发【UI绘制流程解析+原理】
  • 计算机组成原理第七章笔记记录
  • ORB-SLAM2编译、安装等问题汇总大全(Ubuntu20.04、eigen3、pangolin0.5、opencv3.4.10)
  • QuickBuck:一款专为安全研究人员设计的勒索软件模拟器
  • 【八大数据排序法】堆积树排序法的图形理解和案例实现 | C++