当前位置: 首页 > news >正文

dpdk-19.11 对向量指令的使用情况分析

不同向量指令识别关键字

__m128i sse
uint64x2_t neon
__m256i avx2
__m512i avx512
vector altivec

dpdk 向量收发包函数

支持 arm neno 向量收发包函数的 pmd 驱动

bnxt
hns3
i40e
ixgbe
mlx5
virtio

支持 sse 向量收发包函数的 pmd 驱动

axgbe
hinic
fm10k
bnxt
i40e
iavf
ice
ixgbe
mlx5
virtio

支持 avx2 向量收发包函数的 pmd 驱动

bnxt
enic
i40e
iavf
ice
idxd dma 引擎

支持 avx512 向量收发包函数的 pmd 驱动

i40e
iavf
ice
virtio

支持 ppc 架构 altivec 向量收发包函数的 pmd 驱动

i40e
virtio
mlx5

其它使用场景

./common/sfc_efx
./event/dlb2/
./raw/ioat/
./event/cnxk

dpdk lib 中对 simd 的使用场景

distributor 库

distributor 库提供流量动态负载平衡功能,在这种场景下有一个分发器 lcore,负责负载平衡或分发数据包,以及一组 worker lcore,负责从分发器接收数据包和对它们进行操作。
此库中使用 sse 向量指令优化了匹配 flow 的过程。

memcpy 函数优化

使用 sse、avx512 指令优化 memcpy 函数,封装为 rte_memcpy 函数

计算 crc 值

sse、neon、avx512 三种向量指令的不同 crc 计算方式

LPM

DPDK LPM 库组件为 32 位密钥实现最长前缀匹配 (LPM) 表搜索方法,该方法通常用于在 IP 转发应用程序中查找最佳路由匹配。
提供使用 sse、neon 指令实现的 rte_lpm_lookupx4 接口实现最长前缀匹配表搜索。

dpdk ACL 库中 ACL 规则检索优化

  • RTE_ACL_CLASSIFY_SSE
    :向量实现,最多可以并行处理 8 个流。需要 SSE 4.1 支持。要求最大 SIMD 位宽至少为 128。
  • RTE_ACL_CLASSIFY_AVX2
    :向量实现,最多可以并行处理16个流。需要 AVX2 支持。要求最大 SIMD 位宽至少为 256。
  • RTE_ACL_CLASSIFY_NEON
    :向量实现,最多可以并行处理8个流。需要 NEON 支持。要求最大 SIMD 位宽至少为 128。
  • RTE_ACL_CLASSIFY_ALTIVEC
    :向量实现,最多可以并行处理8个流。需要 ALTIVEC 支持。要求最大 SIMD 位宽至少为 128。
  • RTE_ACL_CLASSIFY_AVX512X16
    :向量实现,最多可以并行处理16个流。使用 256 位宽的 SIMD 寄存器。需要 AVX512 支持。要求最大 SIMD 位宽至少为 256。
  • RTE_ACL_CLASSIFY_AVX512X32
    :向量实现,最多可以并行处理32个流。使用 512 位宽的 SIMD 寄存器。需要 AVX512 支持。要求最大 SIMD 位宽至少为 512。

FIB

FIB 库为 32 位密钥或 128 位 IPv6 提供了快速的最长前缀匹配 (LPM) 搜索。它可以用于多种应用,其中最典型的是IPv4/IPv6转发。
FIB 库中使用 avx512 向量指令优化查表过程。

dpdk node 库中 ip4_lookup_node_process 接口的向量实现

ip4_lookup_node_process_vec 函数支持 x86 sse 与 arm neon 向量指令优化。

其它的查表相关使用场景

lib/efd/rte_efd_x86.h
lib/hash/rte_cmp_x86.h
lib/hash/rte_cuckoo_hash.c
lib/hash/rte_thash.h
lib/hash/rte_thash_x86_gfni.h
lib/member/rte_member_x86.h
lib/sched/rte_sched.c
http://www.lryc.cn/news/318604.html

相关文章:

  • 使用CIP采集欧姆龙EtherNet/IP从入门到精通
  • 企业如何高效管理微信里的客户?
  • 怎么在windows系统上查看kylinos的md5、sha1、sha256值
  • Windows中在C#中使用Dapper和Mysql.Data库连接MySQL数据库
  • 大一专科,物联网专业,变态成长偏方!
  • MyBatis入门(JDBC规范,MyBatis,连接池,Lombok)【详解】
  • Vue3--数据和方法
  • 网络编程面试题
  • 移动端区分点击和长按
  • 虚拟环境的激活
  • 宏集案例 | 风电滑动轴承齿轮箱内多点温度采集与处理
  • linux 16进制写入
  • 代码随想录算法训练营第60天| Leetcode 84.柱状图中最大的矩形
  • 编写一个简单的cmakelist.txt
  • 基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的零售柜商品检测软件(Python+PySide6界面+训练代码)
  • 数据库的学习
  • matlab去除图片上的噪声
  • C++超详细知识点(五):类的友元函数和友元类
  • SOC设计:关于reset的细节
  • 支小蜜AI校园防欺凌系统可以使用在宿舍吗?
  • 外卖平台订餐流程架构的实践
  • [AIGC] Spring Boot中的切面编程和实例演示
  • 各个类型和Json类型的相互转换
  • C语言:操作符详解(下)
  • 电商场景下 ES 搜索引擎的稳定性治理实践
  • jdk8与jdk17的区别。springboot2.x与springboot3.x的区别
  • Pytest测试中的临时目录与文件管理!
  • arduino 编程esp8266
  • 基于springboot实现数据资产管理系统项目【项目源码+论文说明】计算机毕业设计
  • 在Java中如何将十进制转换为二进制,八进制,十六进制以及它们之间的互相转换