当前位置: 首页 > news >正文

超标量处理器设计笔记(10) 寄存器重命名过程的恢复、分发

重命名

  • 寄存器重命名过程的恢复
    • 使用 Checkpoint 对 RAT 进行恢复
    • 使用 WALK 对 RAT 进行恢复
    • 使用 Architecture State 对 RAT 进行恢复
    • 总结
  • 分发(Dispatch)

寄存器重命名过程的恢复

当发生异常、分支预测失败时,指令占用 RAT、ROB 和 Issue Queue 等资源恢复

使用 Checkpoint 对 RAT 进行恢复

image.pngl200

对一个正在工作的部件来说,两种方式

image.pngl200

名字随机访问的 GC串行访问 GC
缩写Random Access GC, RAGCSequential Access GC,SAGC
区别将整个内容放到任意 GC 中逐步地移位才能放到指定的 GC 中
和主存储器连接方式连接每个 GC连接单个 GC
要求驱动负载较大(接缓冲器)恢复时,可能需要移位多次
选择更合适
  • MBC(Main Bit Cell)
    • SRAM 最小存储单元
    • 两读一写
  • CBC(Checkpoint Bit Cell)
    • 一读一写

RAT 状态保存时(Allocation):将 MBC 的内容复制到指定的 CBC 中
RAT 状态恢复时( Restore ):将 CBC 的内容复制到指定的 MBC 中

image.pngl200

使用 WALK 对 RAT 进行恢复

ROB 存储了这条指令前对应的物理寄存器,可以逐步倒退

当发现一条分支指令预测失败时,使用分支指令的编号,将流水线中所有相关指令都给抹除
同时暂停流水线,从 ROB 的底端开始(最新的指令),逐条将每条指令之前对应的映射关系写到 RAT 中。

  • 分支预测错误时,首先需要抹除流水线,需要逐个指令地进行恢复,需要消耗很多时间(增大分支预测失败的惩罚)
  • 异常时,只需要恢复,不需要抹掉指令(因为异常需要等到该指令变成最旧的指令时才进行)

占用资源少,可用于处理异常发生频率低的处理器

使用 Architecture State 对 RAT 进行恢复

处理器外部访问逻辑寄存器时,RAT 中存储的是未提交状态,所以不一定

例子:
指令 A 提交成功,此时访问 RAT r1 对应的是 P34,但 D 可能出现异常,由此外部不应该读取这个映射关系
image.pngl200

因此在提交时,也使用一个 RAT,所有正确的流水线指令都会更新 RAT,称为 aRAT(architecture RAT)

利用 aRAT 也可以完成修复

  • 出现分支预测失败时,并不马上进行 RAT 状态修复,而是继续执行,直到运行到该分支指令变成最旧指令时,此时 aRAT 则是正确状态的指令

缺点

  • 流水线中存在 D-cache 缺失的 load 指令时,该分支指令需要等待很长时间才能顺利离开

总结

复位方式CheckpointWALKArchitecture State
内容将 RAT 内容复制出来根据 ROB 序列完成删掉、恢复指令等待分支指令成为最老指令
利用 ARAT 复制
占用资源直接复制比较简单
处理速度可能由于 D-cache 原因变慢
常用于异常发生概率低的处理器中不需要过多处理,降低功耗

分发(Dispatch)

经过重命名后,会进入

  • 队列
    • 发队队列 (out of order)
      • 大部分 FU (function Unit),等待操作数
    • 发射队列 (in order)
      • Store 指令和分支指令
  • 重排序缓存 (ROB)
    • 乱序执行的指令拉回到原始顺序,并且记录指令执行的状态(是否发生异常)
http://www.lryc.cn/news/503704.html

相关文章:

  • 硬件设计-电源轨噪声对时钟抖动的影响
  • geeCache 一致性hash
  • 【我的开源】ESCurlGen 一款 ElasticSearch curl 命令生成器
  • Python库NetworkX介绍
  • Muduo网络库解析--网络模块(2)
  • 【读书笔记】《论语别裁》语文的变与不变
  • elasticsearch 使用预处理将JSON类型转换成Object类型
  • 华为HarmonyOS NEXT 原生应用开发: 数据持久化存储(用户首选项)的使用 token令牌存储鉴权!
  • 每天40分玩转Django:Django视图和URL
  • Kioptirx level4
  • JPG 转 PDF:免费好用的在线图片转 PDF 工具
  • 《Django 5 By Example》阅读笔记:p543-p550
  • 精品基于Python实现的微信小程序校园导航系统-微信小程序
  • 【数字花园】个人知识库网站搭建:①netlify免费搭建数字花园
  • 数据仓库工具箱—读书笔记01(数据仓库、商业智能及维度建模初步)
  • 分布式 窗口算法 总结
  • docker容器内部启动jupyter notebook但是宿主机无法访问的解决方法
  • 2.2 数据库设计方法
  • ALOHA 协议详解
  • Quant connect的优势和不足,学习曲线难
  • 分布式 漏桶算法 总结
  • 2450.学习周刊-2024年50周
  • 前端性能优化实战:从加载到渲染的全链路提升
  • pdf merge
  • Python高性能web框架-FastApi教程:(3)路径操作装饰器方法的参数
  • 怎么禁用 vscode 中点击 go 包名时自动打开浏览器跳转到 pkg.go.dev
  • bean创建源码
  • axfbinhexelf文件区别
  • ABAP时间戳与日期时间转换及时区处理
  • #渗透测试#漏洞挖掘#红蓝攻防#护网#sql注入介绍01