当前位置: 首页 > news >正文

GPGPU基本概念

1、标量计算

        数据定义:标量即为单个数据;
计算模式:D = A * B + C,A、B、C、D均为标量;
数据类型:INT、INT32、FP32、FP32;
计算单元:cuda core。

2、向量计算

        数据定义:可理解为一维数组;
计算模式:D = A * B + C,A、B、C、D均为向量;
数据类型:INT、INT32、FP32、FP32;
计算单元:cuda core。

3、矩阵计算

        数据定义:可理解为二维数组;
计算模式:D = A * B + C,A、B、C、D均为矩阵;
数据类型:INT、INT32、FP32、FP32;
计算单元:cuda core。

4、张量计算

        数据定义:可理解为多维数组;
计算模式:D = A * B + C,A、B、C、D均为向量;
数据类型:INT、INT32、FP32、FP32;
计算单元:tensor core,tensor core提供GEMM(Genernal Matrix Multiply);
举例说明:如RGB三通道彩色图片,有Width/High/Channel三个坐标。

5、CNN

        卷积神经网络(Convolutional Neural Network)

  • 层级结构:输入层->(卷积层->激活函数->池化层)*N->全连接层->批归一化层->丢弃层;
  • 卷积层:提取局部特征(如边缘、纹理);
  • 激活层:引入非线性,使网络能拟合复杂函数;
  • 池化层:降维、平移不变性、减少计算量;
  • 全连接层:整合全局特征用于分类/回归;
  • 批归一化层:加速训练、减少对初始化的敏感度;
  • 丢弃层:训练时随机屏蔽部分神经元(如比例0.5),减少过拟合。

    6、RNN

            循环神经网络(Recurrent Neural Network)

    7、GNN

            图神经网络(Graph Neural Network)

    8、卷积计算

            卷积计算示意图如下,可见卷积计算的主要内容为乘加运算:

    9、激活

    • 作用:引入非线性,使网络能拟合复杂函数;
    • 常用类型ReLU:f(x)=max⁡(0,x)f(x)=max(0,x),缓解梯度消失,计算高效;
      Leaky ReLU:允许负值斜率(如0.01x),缓解神经元死亡;
      Sigmoid/Tanh:少用于中间层(易饱和),多用于输出层(如二分类)。

    10、池化

    • 功能:降维、平移不变性、减少计算量;
    • 类型最大池化(Max Pooling):取窗口内最大值(保留显著特征);
                 平均池化(Average Pooling):取窗口均值(平滑特征);
    • 参数:窗口大小(如2×2)、步长(通常等于窗口大小)。
    http://www.lryc.cn/news/601232.html

    相关文章:

  • 深入解析 Vue 3 中 v-model 与表单元素的绑定机制
  • 北京-4年功能测试2年空窗-报培训班学测开-第六十一天-模拟面试第一次
  • 五自由度磁悬浮轴承转子不平衡振动破壁战:全息前馈控制实战密码
  • 结构化文本文档的内容抽取与版本重构策略
  • 程序代码篇---python获取http界面上按钮或者数据输入
  • LeetCode 611.有效三角形的个数
  • 机器学习项目一基于KNN算法的手写数字识别
  • 设计模式(十二)结构型:享元模式详解
  • AI Coding IDE 介绍:Cursor 的入门指南
  • 设计模式(八)结构型:桥接模式详解
  • 以太坊ETF流入量超越比特币 XBIT分析买币市场动态与最新价格
  • 分类预测 | MATLAB基于四种先进的优化策略改进蜣螂优化算法(IDBO)的SVM多分类预测
  • 机器学习—线性回归
  • 数学基础薄弱者的大数据技术学习路径指南
  • Java Ai (day01)
  • Oracle EBS 库存期间关闭状态“已关闭未汇总”处理
  • 【网络协议安全】任务15:DHCP与FTP服务全配置
  • docker与k8s的容器数据卷
  • S7-1500 与 S7-1200 存储区域保持性设置特点详解
  • 三、搭建springCloudAlibaba2021.1版本分布式微服务-springcloud loadbalancer负载均衡
  • Java 大视界 -- Java 大数据机器学习模型在电商客户细分与精准营销活动策划中的应用(367)
  • 机械学习----knn实战案例----手写数字图像识别
  • 人工智能开发框架 04.网络构建
  • spring gateway 配置http和websocket路由转发规则
  • Linux驱动21 --- FFMPEG 音频 API
  • Spring Boot + @RefreshScope:动态刷新配置的终极指南
  • mysql 快速上手
  • 发布 VS Code 扩展的流程:以颜色主题为例
  • 详解力扣高频SQL50题之1164. 指定日期的产品价格【中等】
  • MCP + LLM + Agent 8大架构:Agent能力、系统架构及技术实践