当前位置: 首页 > news >正文

c语言-位段

有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可。例如开关只有通电和断电两种状态,用01表示足以,也就是用一个二进位。正是基于这种考虑,C语言又提供了一种叫做位域的数据结构

​ **在结构体定义时,我们可以指定某个成员变量所占用的二进制位数(Bit),这就是位域。**请看下面的例子:

struct bs{unsigned m;unsigned n: 4;unsigned char ch: 6;
};

​ **:后面的数字用来限定成员变量占用的位数。**成员m没有限制,根据数据类型即可推算出它占用4个字节(Byte)的内存。成员 nch :后面的数字限制,不能再根据数据类型计算长度,它们分别占用 46 位(Bit)的内存。

nch 的取值范围非常有限,数据稍微大些就会发生溢出,请看下面的例子:

#include <stdio.h>int main(){struct bs{unsigned m;unsigned n: 4;unsigned char ch: 6;} a = { 0xad, 0xE, '$'};//第一次输出printf("%#x, %#x, %c\n", a.m, a.n, a.ch);//更改值后再次输出a.m = 0xb8901c;a.n = 0x2d;a.ch = 'z';printf("%#x, %#x, %c\n", a.m, a.n, a.ch);return 0;
}

运行结果:
0xad, 0xe, $
0xb8901c, 0xd, :

​ 对于n ch,第一次输出的数据是完整的,第二次输出的数据是残缺的。

​ 第一次输出时,nch 的值分别是 0xE0x24'$' 对应的ASCII码为 0x24),换算成二进制是 111010 0100,都没有超出限定的位数,能够正常输出。

​ 第二次输出时,nch 的值变为 0x2d0x7a'z' 对应的ASCII码为 0x7a),换算成二进制分别是 10 1101111 1010,都超出了限定的位数。超出部分被直接截去,剩下110111 1010,换算成十六进制为 0xd0x3a0x3a 对应的字符是 :)。

C语言标准规定,位域的宽度不能超过它所依附的数据类型的长度。通俗地讲,成员变量都是有类型的,这个类型限制了成员变量的最大长度,:后面的数字不能超过这个长度。

​ 例如上面的 bsn 的类型是unsigned int,长度为4个字节,共计32位,那么n后面的数字就不能超过 32ch 的类型是 unsigned char,长度为1个字节,共计8位,那么ch后面的数字就不能超过 8

​ 我们可以这样认为,位域技术就是在成员变量所占用的内存中选出一部分位宽来存储数据。

C语言标准还规定,只有有限的几种数据类型可以用于位域。在ANSI C中,这几种数据类型是intsigned int unsigned intint 默认就是 signed int)。

​ 但编译器在具体实现时都进行了扩展,额外支持了 charsigned charunsigned char 以及enum类型,所以上面的代码虽然不符合C语言标准,但它依然能够被编译器支持。

位域的存储

C语言标准并没有规定位域的具体存储方式,不同的编译器有不同的实现,但它们都尽量压缩存储空间。

​ 位域的具体存储规则如下:
​ 1) 当相邻成员的类型相同时,如果它们的位宽之和小于类型的sizeof大小,那么后面的成员紧邻前一个成员存储,直到不能容纳为止;如果它们的位宽之和大于类型的sizeof大小,那么后面的成员将从新的存储单元开始,其偏移量为类型大小的整数倍。

​ 以下面的位域bs为例:

#include <stdio.h>int main(){struct bs{unsigned m: 6;unsigned n: 12;unsigned p: 4;};printf("%d\n", sizeof(struct bs));return 0;
}

运行结果:
4

mnp 的类型都是 unsigned intsizeof 的结果为4个字节(Byte),也即32个位(Bit)。mnp 的位宽之和为 6+12+4 = 22,小于 32,所以它们会挨着存储,中间没有缝隙。

sizeof(struct bs) 的大小之所以为4,而不是 3,是因为要将内存对齐到4个字节,以便提高存取效率。

​ 如果将成员m的位宽改为 22,那么输出结果将会是 8,因为 22+12 = 34,大于 32n 会从新的位置开始存储,相对m的偏移量是 sizeof(unsigned int),也即4个字节。

​ 如果再将成员p的位宽也改为 22,那么输出结果将会是 12,三个成员都不会挨着存储。

​ 2) 当相邻成员的类型不同时,不同的编译器有不同的实现方案,GCC会压缩存储,而VC/VS不会。

​ 请看下面的位域 bs

#include <stdio.h>int main(){struct bs{unsigned m: 12;unsigned char ch: 4;unsigned p: 4;};printf("%d\n", sizeof(struct bs));return 0;
}

​ 在GCC下的运行结果为 4,三个成员挨着存储;在VC/VS下的运行结果为 12,三个成员按照各自的类型存储(与不指定位宽时的存储方式相同)。

mchp 的长度分别是 414 个字节,共计占用9个字节内存。

​ 3) 如果成员之间穿插着非位域成员,那么不会进行压缩。例如对于下面的 bs

struct bs{unsigned m: 12;unsigned ch;unsigned p: 4;
};

​ 在各个编译器下sizeof的结果都是 12

​ 通过上面的分析,我们发现位域成员往往不占用完整的字节,有时候也不处于字节的开头位置,因此使用&获取位域成员的地址是没有意义的,C语言也禁止这样做。地址是字节(Byte)的编号,而不是位(Bit)的编号。

无名位域

​ 位域成员可以没有名称,只给出数据类型和位宽,如下所示:

struct bs{int m: 12;int  : 20;  //该位域成员不能使用int n: 4;
};

​ 无名位域一般用来作填充或者调整成员位置。因为没有名称,无名位域不能使用。

​ 上面的例子中,如果没有位宽为20的无名成员,mn 将会挨着存储,sizeof(struct bs) 的结果为 4;有了这20位作为填充,mn 将分开存储,sizeof(struct bs) 的结果为 8

http://www.lryc.cn/news/67545.html

相关文章:

  • Servlet3.0 新特性全解
  • PAT A1045 Favorite Color Stripe
  • 真实业务场景使用-门面模式(外观)设计模式
  • 基于多动作深度强化学习的柔性车间调度研究(Matlab代码实现)
  • 出口亚马逊平衡车CE/UKCA认证注意事项
  • 云原生环境下的安全实践:保护应用程序和数据的关键策略
  • vue 改变数据后,数据变化页面不刷新
  • 【Qt编程之Widgets模块】-006:QSortFilterProxyModel代理的使用方法
  • 上林赋 汉 司马相如
  • 7.对象模型
  • 机器学习——基本概念
  • Qt---感觉挺重要的部分
  • springboot+vue家乡特色推荐系统(源码+文档)
  • 在Shell脚本中通过ssh从脚本运行函数
  • 简单学习一下 MyBatis 动态SQL使用及原理
  • WhatsApp如何让客户参与变得更简单?
  • 记一次 MySQL 主从同步异常的排查记录,百转千回
  • Cpython的多线程技术之痛
  • NDK OpenGL离屏渲染与工程代码整合
  • Python基础入门编程代码练习(二)
  • C# | 对象池
  • CSS小技巧之圆形虚线边框
  • QString与QByteArray互相转换的方法
  • Springboot +Flowable,设置流程变量的方式(一)
  • 机器学习13(正则化)
  • 并发编程学习(十一):原子数组、
  • 递归到动态规划:省去枚举行为
  • 服务(第二十一篇)mysql高级查询语句(二)
  • MYSQL高可用配置(MHA)
  • 单精度浮点数与十进制数据相互转换