当前位置: 首页 > news >正文

【自制C++深度学习推理框架】Tensor模板类的设计思路

Tensor模板类的设计思路

为什么要把Armadillo线性代数库arma::fcube封装成Tensor模板类?

arma::fcube是Armadillo线性代数库中的一种数据类型,它是一个三维的float类型张量。Armadillo库是一个C++科学计算库,提供了高效的线性代数和矩阵运算。它支持常用矩阵操作、线性系统求解、特征值求解等功能,并且具有简单易用、高效快速、内存占用少等特点。

将arma::fcube封装成Tensor可以使其更方便地在深度学习等领域中使用,提供了更加直观和易用的接口,同时与其他深度学习框架(如TensorFlow、PyTorch等)进行对接时也比较方便

除了Armadillo库,还有一些其他的常用的线性代数C++库,比如:

  • Eigen:是一个高效的C++线性代数库,支持大部分的矩阵和数组运算,而且提供了矩阵、向量的基本运算方法。

这些线性代数库都是面向高性能计算而设计的,提供了高效、快速、稳定的数字计算模块,可以在科学计算、图像处理、物理模拟等领域中发挥重要作用。

Tensor定义了哪些接口?实现了哪些功能?

Tensor是一个模板类,支持float类型的数据。
Tensor类支持创建张量、访问和修改张量元素,以及一些查询张量属性的功能。
其中还实现了对Tensor对象的复制构造函数、移动构造函数、赋值运算符和移动赋值运算符,并在内部使用了Armadillo线性代数库来存储和操作数据。
它具有以下接口和功能:

构造函数

  • explicit Tensor() = default; // 默认构造函数
  • explicit Tensor(uint32_t channels, uint32_t rows, uint32_t cols); // 创建张量并指定通道数、行数和列数
  • explicit Tensor(const std::vector<uint32_t>& shapes); // 根据形状(shape)创建张量
  • Tensor(const Tensor& tensor); // 复制构造函数
  • Tensor(Tensor&& tensor) noexcept; // 移动构造函数

赋值运算符

  • Tensor& operator=(Tensor&& tensor) noexcept; // 移动赋值运算符
  • Tensor& operator=(const Tensor& tensor); // 赋值运算符

访问张量维度属性接口

  • uint32_t rows() const; // 返回张量的行数
  • uint32_t cols() const; // 返回张量的列数
  • uint32_t channels() const; // 返回张量的通道数
  • uint32_t size() const; // 返回张量中元素的数量
  • bool empty() const; // 返回张量是否为空
  • std::vector<uint32_t> shapes() const; // 返回张量尺寸大小
  • const std::vector<uint32_t>& raw_shapes() const; // 返回张量实际尺寸大小

访问张量元素接口

  • float index(uint32_t offset) const; // 返回张量中offset位置的元素
  • float& index(uint32_t offset); // 返回张量中offset位置的元素(可写)
  • arma::fmat& slice(uint32_t channel); // 返回张量第channel通道中的数据
  • const arma::fmat& slice(uint32_t channel) const; // 返回张量第channel通道中的数据
  • float at(uint32_t channel, uint32_t row, uint32_t col) const; // 返回特定位置的元素

访问张量接口

  • arma::fcube& data(); // 返回张量中的数据
  • const arma::fcube& data() const; // 返回张量中的数据
  • void Show(); // 输出张量

修改张量接口

  • void set_data(const arma::fcube& data); // 设置张量中的具体数据
  • void Ones(); // 设置张量全为1
  • void Rand(); // 随机生成张量(服从标准正太分布,即以0为均值、以1为标准差的正态分布)
  • void Padding(const std::vector<uint32_t> &pads, float padding_value); // 边界填充
  • void Fill(float value); // 用标量值填充
  • void Fill(const std::vector &values); // 用vector填充
  • void ReRawshape(const std::vector<uint32_t>& shapes); // 列优先reshape
  • void ReRawView(const std::vector<uint32_t>& shapes); // 行优先reshape
  • void Transform(const std::function<float(float)>& filter); // 对张量中的元素进行过滤
  • void Flatten(); // 展平张量

为什么这里有两种reshape,因为Armadillo的张量是列优先的,而pytorch实现的reshape是行优先的,
所以我们用一个接口保留列优先的reshape,定义另一个接口来实现行优先的reshape,兼容并对接pytorch。

为什么要定义一个CSV文件数据读取类?

由于CSV文件是一种常见且常用的数据格式,因此这个类方便于数据转换数据读取
CSVDataLoader类主要作用是提供一种便捷的方式来从CSV文件读取数据并转换成fmat矩阵类型,
在这个CSV文件数据读取类中定义了静态方法LoadData和GetMatrixSize来从CSV文件中加载数据和获取CSV文件的尺寸大小。

  • 其中,LoadData方法用于从CSV文件中加载数据并返回一个Armadillo库中的fmat矩阵,该方法的参数包括需要读取的CSV文件路径和分隔符。
  • 而GetMatrixSize方法用于获取CSV文件的尺寸大小,该方法用于在LoadData方法中初始化返回的fmat矩阵,同时该方法也传入CSV文件路径和分隔符两个参数。
http://www.lryc.cn/news/69477.html

相关文章:

  • linux--systemd、systemctl
  • 加密解密软件VMProtect教程(七):主窗口之控制面板“详情”部分
  • 国产仪器 4945B/4945C 无线电通信综合测试仪
  • 数据库原理及应用上机实验一
  • 【操作系统】线程常用操作
  • C++编译预处理
  • Spring IOC 的理解
  • Linux 学习笔记(七):时间片
  • java并发-ReentrantLock
  • 21.模型的访问器和修改器
  • 72 yaffs文件系统挂载慢 sync不起作用
  • 【无标题】春漫乌海湖!
  • Red Hat重置root密码
  • 应急响应之日志排查方法,Linux篇
  • Midjourney AI 官方中文版已开启内测申请;OpenAI 正准备向公众发布一款新的开源语言模型。
  • DevOps 的道术法器,探寻 DevOps “立体化”实践之旅
  • redis 7.x 缓存双写一致性的解决方案
  • 真题详解(语法分析输入记号流)-软件设计(八十)
  • ffmpeg-编译汇总01
  • 素雅的登录界面,简单而优雅
  • Docker数据目录迁移方法
  • C++——动态规划
  • 【FAQ】视频编辑服务常见问题及解答
  • JavaEE(系列8) -- 多线程案例(单例模式)
  • 深度剖析,如何从底层代码层面理解Selenium和Appium的关联
  • 【Three.js】第一、二章 入门指南和基础知识
  • 力扣第 104 场双周赛 2681. 英雄的力量
  • 在linux上创建crypto_LUKS格式的块设备
  • 76.建立一个主体样式第二部分
  • SQL删除重复的记录(只保留一条)-窗口函数row_number()