当前位置: 首页 > news >正文

Linux RDMA Maillist patchsets (Jul. 7 - Jul. 13, 2025)

1. Optimize DMABUF Mkey Page Size in mlx5
优化 mlx5 中的 DMABUF Mkey 页大小

This patch series enables the mlx5 driver to dynamically select the optimal page size for DMABUF-based memory keys (mkeys), rather than relying on a fixed page size during registration.
该补丁集使 mlx5 驱动能够为基于 DMABUF 的内存密钥(mkey)动态选择最优的页大小,而不再在注册时依赖固定的页大小。

Previously, DMABUF memory registration always used a fixed 4KB page size for mkeys. This could lead to suboptimal performance, especially when the underlying memory layout supports larger page sizes.
此前,DMABUF 内存注册始终为 mkey 使用固定的 4KB 页大小。这种做法在底层内存布局支持更大页大小的情况下,会导致性能不佳。

The previous approach did not leverage the hardware's advertised capabilities for larger page sizes. Moreover, the driver failed to set the appropriate page size mask in the mkey configuration, which could result in invalid registrations when switching to very large pages.
这种旧的实现方式没有利用硬件公开支持的大页能力。此外,驱动程序在配置 mkey 时未设置正确的页大小掩码,在切换到非常大的页时可能导致注册无效。

This series improves DMABUF performance by:
本系列补丁通过以下方式提升了 DMABUF 的性能:

Dynamically selecting the best page size for a given memory region (MR) at creation time and upon page faults.
在内存区域(MR)创建时以及发生页错误时,动态选择最合适的页大小。

Correcting gaps in the previous implementation related to page size mask handling.
修复了此前实现中关于页大小掩码处理的缺陷。

By reducing the number of page table entries (and thus MTT/KSM descriptors) that the Host Channel Adapter (HCA) must walk through, this optimization lowers cache-line fetches and improves overall efficiency.
通过减少主机通道适配器(HCA)需遍历的页表项数量(从而减少 MTT/KSM 描述符),此优化降低了缓存行的访问次数,提高了整体效率。

2. RDMA: Support CQs with User Memory
RDMA:支持使用用户空间内存创建 CQ

This patch series introduces a standardized mechanism for creating Completion Queues (CQs) using preallocated memory supplied by userspace.
本系列补丁引入了一种

http://www.lryc.cn/news/587526.html

相关文章:

  • 【LeetCode240.搜索二维矩阵Ⅱ】以及变式
  • 传统机器学习在信用卡交易预测中的卓越表现:从R²=-0.0075到1.0000的华丽转身
  • 【Hadoop科普篇】大数据怎么处理?Hadoop是什么?跟HDFS, Spark, Flink, Hive, Hbase是什么关系?
  • React Three Fiber 实现 3D 模型视图切换、显隐边框、显隐坐标轴
  • JavaScript 性能优化实战:深入性能瓶颈,精炼优化技巧与最佳实践
  • 如何彻底解决PLM/ERP/MES等系统访问速度慢问题?
  • ThinkPHP 8 在 Apache 下启用伪静态
  • .NET 9 GUID v7 vs v4:时间有序性如何颠覆数据库索引性能
  • 【python实用小脚本-139】Python 在线图片批量下载器:requests+PIL 一键保存网络图像
  • Docker 拉取镜像并离线迁移至云桌面指南(以Redis为例)
  • 2025 春秋杯夏季个人挑战赛 Web
  • Spark SQL 之 UT
  • 实战:如何创建 AWS RDS 数据库
  • Android 16k jni修改
  • 构建高效事件驱动架构:AWS S3与SQS集成实践指南
  • 如何连接 AWS RDS 数据库实例
  • AWS RDS PostgreSQL可观测性最佳实践
  • 2025最新android面试指南
  • (三)OpenCV——图像形态学
  • 爬虫-爬取豆瓣top250
  • Android 16系统源码_窗口动画(一)窗口过渡动画层级图分析
  • Android编译系统——基础介绍(一)
  • LVS集群技术
  • 17.Python 中的相等性比较:== vs is
  • 云原生核心技术解析:Docker vs Kubernetes vs Docker Compose
  • 深入了解linux系统—— 进程信号的保存
  • 数据可视化全流程设计指南
  • Vue 低代码可视化表单设计器 FcDesigner v3.3 版本发布!表格布局升级+精细化权限控制
  • 前端常见十大问题讲解
  • Spark 之 like 表达式