当前位置: 首页 > news >正文

ARM发布新一代高性能处理器N3

简介

就在2月21日,ARM发布了新一代面向服务器的高性能处理器N3和V3,N系列平衡性能和功耗,而V系列则注重更高的性能。此次发布的N3,单个die最高32核(并加入到CCS,Compute Subsystems,包含Core,System Ip等),以CCS来讨论,每瓦性能比上一代提升20%-50%。而Neoverse V3,单个die最高64核(加入CCS),ARM似乎更强调其AI相关的分析能力,并于Neoverse V2 相比,Neoverse V3 在机器学习方面提供了+96%的性能提升,在RDBMS上提供了+16%的性能提升,在加密货币方面提供了+9%的性能提升,在整数工作负载方面提供了+12% 的性能提升。与此同时,相关的系统IP同时发布,例如新一代的CMN S3,这将取代前一代的CMN700,但没有更多的信息。

V3微架构的改变

Neoverse™ V3处理器应用 Arm®v9.2-A架构,Core接口使用DSU-120,Core总体性能提升没有官方数据,部分分析认为相比较前代提升大约在10~20%。

MMU

MMU,左为V3,右为V2

MMU,左为V3,右为V2

MMU仍然延续经典的2级TLB结构,更细节的微架构设计手册没有过多的描述,Translation Cache,聚合,预取等传统技术依然存在,对于L2 TLB,3代微架构没有明显的改变。最大的改变是 L1 TLB,其中ITLB的entry从V2的48entry升级到V3的128entry,而DTLB 从48entry升级为96entry。最具特点的是ITLB的巨大升级,可能是为了应对AI场景下,指令集地址变化更频繁。这也是为什么ARM对V3更强调AI场景的分析。

L1 Cache

ICache,上为V3,下为V2

ICache,上为V3,下为V2

ICache的改变主要在V3抛弃了Macro-Operation Cache(手册没提,应该是放弃了),这里亦安分析可能是对于精简指令集,这种做法性价比不高,或者设计确实没有达到理想的状态,再者,ARM本身非常关注功耗,所以在V3处理器版本抛弃了这种微架构。手机端A77,A78,X1,X2,X3均具有MOPCache,X4放弃该微架构。

DCache在参数上描述无差异。

L2 Cache

L2 cache,上V3,下V2

L2 cache,上V3,下V2

L2从官方描述上看,从原来的V2(1-2MB)升级V3(2-3MB),其它参数没有明显变化,详细的微架构尚不清楚。

总结

由于V3/N3刚刚发布,其它例如预测器,乱序等模块的微架构尚不清晰,等待公布更多信息再聊,除去按照惯例的性能提升描述,比较值得关注的是ARM对处理器涉及AI分析的强调,由此可以知道近几年AI发展对整个芯片行业的巨大冲击,似乎只有往AI上靠,才会获得市场的青睐,这一场AI争夺战已经进入白热化,芯片行业本身就处在中心。

http://www.lryc.cn/news/431002.html

相关文章:

  • 基于Pytorch框架的深度学习U2Net网络天空语义精细分割系统源码
  • 50ETF期权和股指期权有什么区别?ETF期权应该怎么做?
  • JS设计模式之“神奇的魔术师” - 简单工厂模式
  • 【河北航空-注册安全分析报告-无验证方式导致安全隐患】
  • 亚信安慧AntDB-T数据库内核之MVCC机制
  • 【python】socket 入门以及多线程tcp链接
  • 【ZYNQ MPSoC开发】lwIP TCP发送用于数据缓存的软件FIFO设计
  • 【TVM 教程】在 Relay 中使用外部库
  • 2024最新大厂面试:汇川嵌入式面试题及参考答案
  • tcp 流量控制
  • linux离线安装nacos
  • 云原生 | 在 Kubernetes 中使用 Cilium 替代 Calico 网络插件实践指南!
  • 【重学 MySQL】十一、SQL 概述
  • (一)模式识别——基于SVM的道路分割实验(附资源)
  • Python | Leetcode Python题解之第391题完美矩形
  • Rust模块std::thread
  • Leetcode Day20 打家劫舍
  • 云计算之数据库
  • 开发软件,什么类型的重要信息的日志要存到数据库表里面
  • websocket和轮询的区别?
  • 2024 年全国大学生数学建模竞赛(国赛)浅析
  • 持续集成与持续部署(CI/CD)的深入探讨
  • hyperf json-rpc
  • 基于SpringBoot的外卖点餐系统
  • 网络编程day02(字节序、TCP编程)
  • 萌新6:临场发挥(区间dp)
  • 《数字信号处理》学习04-离散时间系统中的线性时不变系统
  • ABAP 调试宏DEFINE
  • Golang | Leetcode Golang题解之第393题UTF-8编码验证
  • HarmonyOS开发实战( Beta5.0)DevEco Device Tool开发环境搭建实践