当前位置: 首页 > news >正文

79、avx2 向量指令集优化卷积运算

上一节 介绍了 avx2 向量指令集中的 load/store 操作,本节介绍如何使用 avx2 的向量指令集来实现乘累加运算。

因为我们实战中用到的 resnet50 神经网络中,卷积运算在整个模型中的比例占据是相当高,而卷积运算的核心计算就是乘累加计算。因此,只要将最核心的乘累加计算效率提高,那么整个模型的性能就会有大幅度的提高。

这一节在介绍向量寄存器的时候,举了一个例子来说明向量加法的计算,向量乘法和向量加法一样,下面我们就用实际的代码来展示,如何完成向量乘法的计算。

avx2 完成向量乘法

完成向量乘法的运算过程也很简单:

首先利用load指令将数据从内存中 load 到向量寄存器中;

然后调用 __mm256_mul_ps 指令,完成两个向量的乘法,返回结果,最后对结果进行累加操作。

由于在卷积运算中,需要累加的都是 channel 维度,除了一层卷积channle维度是 3 之外,其余层的卷积

http://www.lryc.cn/news/285166.html

相关文章:

  • 【AI】人工智能和图像编码(2)
  • 2023 巅峰之作 | AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战
  • com域名注册腾讯云价格
  • mysql从库重新搭建的流程
  • 用户ssh正确密码登陆树莓派镜像均报错Permission denied, please try again.处理方法
  • SpringBoot 统计API接口用时该使用过滤器还是拦截器?
  • Python sleep函数用法:线程睡眠
  • 50-Js控制元素显示隐藏
  • LC213. 打家劫舍 II
  • Django REST Framework入门之序列化器
  • AI对比:ChatGPT与文心一言的异同与未来
  • elasticsearch备份恢复,elasticdump使用
  • 【C++干货铺】C++11新特性——右值引用、移动构造、完美转发
  • 5G_射频测试_基础概念(二)
  • 【笔记】Helm-3 主题-10 Kubernetes分发指南
  • ROS第 13 课 TF 坐标系广播与监听的编程 实现
  • flask 与小程序 菜品详情和分享功能
  • C语言通过MSXML6.0读写XML文件(同时支持char[]和wchar_t[]字符数组)
  • 在react中说说对受控组件和非受控组件的理解?以及应用场景
  • 【算法练习Day50】下一个更大元素II接雨水
  • 深耕文档型数据库12载,SequoiaDB再开源
  • json解析
  • 【AI】深度学习在编码中的应用(8)
  • 什么是VUE 创建第一个VUE实例
  • 进程间协同:从进程启动、同步与互斥到进程间通信
  • 【驱动】TI AM437x(内核调试-06):网卡(PHY和MAC)、七层OSI
  • Java基础面试题 Object
  • 5G_射频测试_接收机测量(五)
  • ESP32-HTTP_webServer库(Arduino)
  • 无法找到mfc100.dll的解决方法分享,如何快速修复mfc100.dll文件