当前位置：首页 > news >正文

【自制C++深度学习推理框架】Tensor模板类的设计思路

news 2025/9/9 21:51:22

Tensor模板类的设计思路

为什么要把Armadillo线性代数库arma::fcube封装成Tensor模板类？

arma::fcube是Armadillo线性代数库中的一种数据类型，它是一个三维的float类型张量。Armadillo库是一个C++科学计算库，提供了高效的线性代数和矩阵运算。它支持常用矩阵操作、线性系统求解、特征值求解等功能，并且具有简单易用、高效快速、内存占用少等特点。

将arma::fcube封装成Tensor可以使其更方便地在深度学习等领域中使用，提供了更加直观和易用的接口，同时与其他深度学习框架(如TensorFlow、PyTorch等)进行对接时也比较方便。

除了Armadillo库，还有一些其他的常用的线性代数C++库，比如：

Eigen：是一个高效的C++线性代数库，支持大部分的矩阵和数组运算，而且提供了矩阵、向量的基本运算方法。

这些线性代数库都是面向高性能计算而设计的，提供了高效、快速、稳定的数字计算模块，可以在科学计算、图像处理、物理模拟等领域中发挥重要作用。

Tensor定义了哪些接口？实现了哪些功能？

Tensor是一个模板类，支持float类型的数据。
Tensor类支持创建张量、访问和修改张量元素，以及一些查询张量属性的功能。
其中还实现了对Tensor对象的复制构造函数、移动构造函数、赋值运算符和移动赋值运算符，并在内部使用了Armadillo线性代数库来存储和操作数据。
它具有以下接口和功能：

构造函数

explicit Tensor() = default; // 默认构造函数
explicit Tensor(uint32_t channels, uint32_t rows, uint32_t cols); // 创建张量并指定通道数、行数和列数
explicit Tensor(const std::vector<uint32_t>& shapes); // 根据形状(shape)创建张量
Tensor(const Tensor& tensor); // 复制构造函数
Tensor(Tensor&& tensor) noexcept; // 移动构造函数

赋值运算符

Tensor& operator=(Tensor&& tensor) noexcept; // 移动赋值运算符
Tensor& operator=(const Tensor& tensor); // 赋值运算符

访问张量维度属性接口

uint32_t rows() const; // 返回张量的行数
uint32_t cols() const; // 返回张量的列数
uint32_t channels() const; // 返回张量的通道数
uint32_t size() const; // 返回张量中元素的数量
bool empty() const; // 返回张量是否为空
std::vector<uint32_t> shapes() const; // 返回张量尺寸大小
const std::vector<uint32_t>& raw_shapes() const; // 返回张量实际尺寸大小

访问张量元素接口

float index(uint32_t offset) const; // 返回张量中offset位置的元素
float& index(uint32_t offset); // 返回张量中offset位置的元素(可写)
arma::fmat& slice(uint32_t channel); // 返回张量第channel通道中的数据
const arma::fmat& slice(uint32_t channel) const; // 返回张量第channel通道中的数据
float at(uint32_t channel, uint32_t row, uint32_t col) const; // 返回特定位置的元素

访问张量接口

arma::fcube& data(); // 返回张量中的数据
const arma::fcube& data() const; // 返回张量中的数据
void Show(); // 输出张量

修改张量接口

void set_data(const arma::fcube& data); // 设置张量中的具体数据
void Ones(); // 设置张量全为1
void Rand(); // 随机生成张量（服从标准正太分布，即以0为均值、以1为标准差的正态分布）
void Padding(const std::vector<uint32_t> &pads, float padding_value); // 边界填充
void Fill(float value); // 用标量值填充
void Fill(const std::vector &values); // 用vector填充
void ReRawshape(const std::vector<uint32_t>& shapes); // 列优先reshape
void ReRawView(const std::vector<uint32_t>& shapes); // 行优先reshape
void Transform(const std::function<float(float)>& filter); // 对张量中的元素进行过滤
void Flatten(); // 展平张量

为什么这里有两种reshape，因为Armadillo的张量是列优先的，而pytorch实现的reshape是行优先的，
所以我们用一个接口保留列优先的reshape，定义另一个接口来实现行优先的reshape，兼容并对接pytorch。

为什么要定义一个CSV文件数据读取类？

由于CSV文件是一种常见且常用的数据格式，因此这个类方便于数据转换，数据读取。
CSVDataLoader类主要作用是提供一种便捷的方式来从CSV文件读取数据并转换成fmat矩阵类型，
在这个CSV文件数据读取类中定义了静态方法LoadData和GetMatrixSize来从CSV文件中加载数据和获取CSV文件的尺寸大小。

其中，LoadData方法用于从CSV文件中加载数据并返回一个Armadillo库中的fmat矩阵，该方法的参数包括需要读取的CSV文件路径和分隔符。
而GetMatrixSize方法用于获取CSV文件的尺寸大小，该方法用于在LoadData方法中初始化返回的fmat矩阵，同时该方法也传入CSV文件路径和分隔符两个参数。

查看全文

http://www.lryc.cn/news/69477.html