当前位置: 首页 > news >正文

【C语言】结构体与内存对齐

前言

在本篇博客,我将介绍结构体类型,结构体变量的创建和初始化,重点介绍结构中存在的内存对齐。

结构变量

结构是一些值的集合,这些值被称为成员变量。结构的每个成员可以是不同类型的变量。

在理解结构的时候,我们可以结合我们此前学过的数组的概念去对比着理解。

数组:                                              结构:

一些值的集合                                    一些值的集合

1个或多个值                                     1个或多个值

值的类型是相同的                            值的类型可以不同

而且,为了数组元素我们需要指明元素的位置(下标);而选择指定的结构成员我们是指明成员名字而非位置。

结构变量的创建

当我们需要存储彼此相关、类型不同的信息(数据)时,结构是一种很好的选择。

假如,我们现在记录一本书的相关信息,涉及到书名、作者名、价格、书号(id),这就是一个声明结构体变量的例子:

#include<stdio.h>
struct Book
{char book_name[20];char author[20];float price;char id[19];
}b3,b4;//可以在创建这个结构时直接创建变量//此时的b3、b4会作为全局变量int main()
{struct Book b1;//在main函数中创建,局部结构变量struct Book b2;
}

对结构声明的形式进行概括,是这样的:

struct tag//struct是结构体关键字,tag是标识符
{member - list;//成员列表
}variable-list;//变量列表

结构声明的括号后一定要记得加分号

结构变量的初始化 

我们可以在上面的代码基础上对4个结构变量初始化:

#include<stdio.h>
struct Book
{char book_name[20];char author[20];float price;char id[19];
}b3 = { "Call me by your name","Andre Acimen",29.1f,"9787513598255" },
b4 = {"Matilda","Roald Dahl",18.0f,"9787533259532"};int main()
{struct Book b1 = {"Flipped","Wendelin Van Draanen",16.99f,"9780375911743"};struct Book b2 = {"The Kite Runner","Khaled Hosseini",29.0f,"9787208061644"};
}

其实我们还可以不按照结构声明时成员的顺序来初始化,只要我们用"."来初始化:

struct Book
{char book_name[20];char author[20];float price;char id[19];
}b3 = { .author="Andre Acimen",.book_name = "Call me by your name",.id="9787513598255",.price = 29.1f },
b4 = {"Matilda","Roald Dahl",18.0f,"9787533259532"};

可以看到我们将b3的初始化顺序进行了调整。

结构体的特殊声明

其实,在声明结构时我们可以不完全声明

struct
{char c;int i;double d;
}s1;

观察这个声明,可以发现我们没有了tag,也就是类型的名字。所以这也叫匿名结构体类型

但这样写,用这个结构进行变量的声明就变成了一次性的。

现在,为了更详细地体现这种写法的特性,请看下面这段代码:

struct
{char c;int i;double d;
}s1;struct
{char c;int i;double d;
}*ps;int main()
{ps = &s1;return 0;
}

什么意思呢?

我们创造了一个结构类型,又用相同的成员创造了一个指针变量ps,所以ps指向一个与前面创造的匿名类型相同的结构体变量,既然是一模一样的结构类型,在main函数中我们想让ps指向s1,这是可以的吗?看似很合理。

但是,这是不允许的。因为编译器会认为最初声明的这个匿名结构与后面用来创建ps的结构不是同一个结构类型,所以不能赋值。这就是匿名结构声明的一个特点。

结构体内存对齐

这是关于结构体一个很重要的知识,需要运用的场景往往是计算结构体大小时。

结构体有大小吗?有的,但并不是每个成员类型的大小相加这么简单。

struct S1
{char c1;//1字节char c2;//1字节int n;//4字节
};
struct S2
{char c1;//1字节int n;//4字节char c2;//1字节
};
int main()
{printf("%zd\n", sizeof(struct S1));printf("%zd\n", sizeof(struct S2));return 0;
}

打印结果:

 可以看到,结构体S1和S2中的成员大小的和都为6字节,而S1大小为8字节,S2大小为12字节。

这是为什么呢?

这是因为,结构体在内存中是存在对齐现象的。

在讲解什么是对齐现象前,我们先来讲一个概念:偏移量

偏移量(Offset),在C语言中通常指的是结构体(struct)或联合体(union)内成员的位置。在结构体中,第一个成员的偏移量总是0。

(空格里代表的就是偏移量)

我们有一个offsetof(type,member),可以计算结构成员相较于结构体变量起始位置的偏移量。 type就是要计算的结构,member是结构体成员名。

使用它需要一个头文件,#include<stddef.h>。

那么,我们现在就用它来计算一下S1中各个成员的偏移量吧:

#include<stdio.h>
#include<stddef.h>struct S1
{char c1;char c2;int n;
};
struct S2
{char c1;int n;char c2;
};
int main()
{struct S1 s1 = { 0 };printf("%zd\n", offsetof(struct S1, c1));printf("%zd\n", offsetof(struct S1, c2));printf("%zd\n", offsetof(struct S1, n));return 0;
}

运行结果:

所以,我们可以画出S1在内存的存储方式:

 

可以看到,偏移量为2和3的两个字节被浪费了。

 

现在,我们再次用offsetof来计算一下S2中各个成员的偏移量:

printf("%zd\n", offsetof(struct S2, c1));
printf("%zd\n", offsetof(struct S2, n));
printf("%zd\n", offsetof(struct S2, c2));

于是,我们又可以画出S2在内存中的存放:

 

但这时可不要以为就在c2结束的时候S2就结束了,可以看到我们上面sizeof得到的S2的字节数是12,而c2结束时才9个字节。也就是说,偏移量为9~11的3个字节也被我们浪费了。

这些现象究竟是为什么呢?这时就不得不说明对齐的规则了:

 对齐规则

1.结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处。

2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。

        对齐数:编译器默认的一个对齐数与该成员变量大小的较小值

                在vs中,默认为8;

                Linux中gcc没有默认对齐数,对齐数就是成员自身大小。

3.结构体总大小为最大对齐数(结构体每个成员变量对齐数中最大的)的整数倍。

4.如果结构体嵌套了结构体,嵌套的结构体对齐到自己成员中最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍。

用这些规则再回去看上面的S1和S2,你会发现都是对应得上的。但这里我们不妨再举一个例子:

#include<stdio.h>struct S3
{double d;char c;int i;
};
int main()
{printf("%zd\n", sizeof(struct S3));return 0;
}

那么我们现在看一下按照规则来分配我们的内存,得到的结果会不会是16:

 

所以我们根据对齐规则,内存中S3的分配应该是:

根据规则一步步走,我们就可以得到这个分配,确实是16个字节。

结构体嵌套情况:

 为了体现规则的第四条,我们再来举一个结构体嵌套的例子:

#include<stdio.h>struct S3
{double d;char c;int i;
}s3;struct S4
{char c1;
//嵌套一个结构体S3,我们在前面已算出S3大小为16字节struct S3 s3;double d;
};int main()
{printf("%zd\n", sizeof(struct S4));//算S4大小return 0;
}

那么我们按照规则来画一下S4的内存,看看是不是32字节:

 

so,

 

可以看到,确实就是满足规则的。 

为什么存在对齐 

说到这里,你可能会好奇,为什么存在对齐呢?这里有两种主要的原因:

 1.平台原因:

不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址上取某些特定类型的数据,否则将抛出硬件异常。

2.性能原因:

数据结构(尤其是栈)应该尽可能地在自然界边界上对齐。原因在于,为了访问未对齐的内存,处理器可能要作两次内存访问;而对齐的内存访问仅需一次访问。(假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数,那么就可以用一个内存操作来读或写值了。否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中。)

总的来说,结构体中的内存对齐总是拿空间来换取时间的做法。

(懒得用pro重画了,手写勿介意) 

设计结构体的注意事项:

上面说了,结构体对齐现象是一种拿空间换时间的策略,而在设计结构体的时候,我们有一种可以既满足对齐又节省空间的做法:

让占用空间小的成员尽量集中在一起。(集中就行,不用把占用空间小的成员先声明)

(有兴趣的朋友可以自己画图看看)

修改默认对齐数

我们知道了默认对齐数的概念,那么我们是否能够修改默认对齐数呢?是可以的:

#pragma这个预处理指令,可以改变编译器的默认对齐数。

例如:

这是修改前的s的大小

 

 这是修改后的:

可以看到,修改默认对齐数可以让我们的结构体大小变小。

到此,本篇博客内容就全部结束了,祝阅读愉快^-^ 

http://www.lryc.cn/news/361513.html

相关文章:

  • 【机器学习】之 kmean算法原理及实现
  • 国产高边驱动HD70202Q替换英飞凌BTS7040-2
  • 2024年06月在线IDE流行度最新排名
  • 顺序表和链表基础操作的复习
  • [C#]winform部署官方yolov10目标检测的onnx模型
  • hmcode硬件编程1
  • [C++][CMake] set_target_properties called with incorrect number of arguments
  • AdamW算法
  • 【c++进阶(二)】STL之string类的模拟实现
  • PHPStudy(xp 小皮)V8.1.1 通过cmd进入MySQL命令行模式
  • php反序列化初步了解
  • Windows系统电脑本地部署AI音乐创作工具并实现无公网IP远程使用
  • 玩转Linux进度条
  • 真国色码上赞,科技流量双剑合璧,商家获客新纪元开启
  • C++:特殊类设计和四种类型转换
  • (南京观海微电子)——屏幕材质及优缺点对比
  • uniapp uni.showModal 出现点击没有反应
  • Vue3-VueRouter
  • 【图像处理与机器视觉】频率域滤波
  • python第五次作业
  • JS面向对象编程
  • kotlin1.8.10问题导致gson报错TypeToken type argument must not contain a type variable
  • 数据库漫谈-国产数据库
  • 小白跟做江科大32单片机之光敏传感器控制蜂鸣器
  • 使用 Django Channels 构建实时聊天应用(包含用户认证和消息持久化)
  • 【Elasticsearch】es基础入门-03.RestClient操作文档
  • LeetCode - 二分查找(Binary Search)算法集合(Python)[左右边界|旋转数组|双列表]
  • android睡眠分期图
  • 2023年信息素养大赛小学组C++智能算法复赛真题
  • 独立游戏开发的 6 个步骤