13 C 语言 struct 实战手册:位段用法详解 + 结构体内存对齐计算 + 关键注意事项

发布于:2025-09-03 ⋅ 阅读:(14) ⋅ 点赞:(0)

 数据在内存中的存储

1 ⼤⼩端字节序和字节序判断

什么是⼤⼩端?

其实超过⼀个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分 为⼤端字节序存储和⼩端字节序存储,下⾯是具体的概念: ⼤端(存储)模式:是指数据的低位字节内容保存在内存的⾼地址处,⽽数据的⾼位字节内容,保存 在内存的低地址处。 ⼩端(存储)模式:是指数据的低位字节内容保存在内存的低地址处,⽽数据的⾼位字节内容,保存 在内存的⾼地址处。 上述概念需要记住,⽅便分辨⼤⼩端。

为什么有⼤⼩端?

为什么会有⼤⼩端模式之分呢? 这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着⼀个字节,⼀个字节为8bit位,但是在C语⾔中除了8bit的 char 之外,还有16bit的 short 型,32bit的 long 型(要看具体的编译器),另外,对于位数⼤于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度⼤于⼀个字节,那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了⼤端存储模式和⼩端存储模式。* 例如:⼀个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么0x11 为⾼字节, 0x22 为低字节。对于⼤端模式,就将 0x11 放在低地址中,即 0x0010 中,0x22 放在⾼地址中,即 0x0011 中。⼩端模式,刚好相反。我们常⽤的 X86 结构是⼩端模式,⽽KEIL C51 则为⼤端模式。很多的ARM,DSP都为⼩端模式。有些ARM处理器还可以由硬件来选择是⼤端模式还是⼩端模式。

练习

练习1--判断当前机器的大小端

请简述⼤端字节序和⼩端字节序的概念,设计⼀个⼩程序来判断当前机器的字节序。(10分)-百度笔 试题

#include <stdio.h>
int check_sys()
{
	int i = 1;//补码:00000000 00000000 00000000 00000001
	return (*(char *)&i);//取出i的最低地址的字节的值
}
int main()
{
	int ret = check_sys();
	if(ret == 1)
	{
		printf("⼩端\n");
	}
	else
	{
		printf("⼤端\n");
	}
return 0;
}

⾃定义类型:结构体

前置认识:结构是⼀些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

就是不同类型变量的打包。

声明和定义的区别

声明就是告诉编译器有这个类型的变量实际上没有给这个类型的变量申请空间定义对象。

定义就是向内存申请空间定义出这个类型的变量。

主要区别就是有没有申请内存

1 结构的声明

struct Stu //struct Stu--关键字加标签名Stu才是数据类型
{
	char name[20]; //名字
	int age; //年龄
	char sex[5]; //性别
	char id[20]; //学号
}; 

2 结构体变量的创建和初始化

//按照结构体成员的顺序初始化
struct Stu s = { "张三", 20, "男", "20230818001" };//花括号

3 结构的特殊声明

在声明结构的时候,可以不完全的声明。

//匿名结构体类型 --不要标签名--所以没有具体的类型所以声明出来
//也不能用来定义出其结构体对象,只能在声明时定义匿名对象出来
struct
{
	int a;
	char b;
	float c;
}x;

struct
{
	int a;
	char b;
	float c;
}a[20], *p;
//匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使⽤⼀次
//在上⾯代码的基础上,下⾯的代码合法吗?
p = &x//两个没有标签的结构体类型是不同的类型

4结构的⾃引⽤

在结构中包含⼀个类型为该结构本⾝的成员是否可以呢? ⽐如,定义⼀个链表的节点:

struct Node
{
	int data;
	struct Node next;
};
//当定义一个struct Node对象时,这个对象里面要定义一个data对象和struct Node对象,这个struct Node对象里面又要定义一个data对象和struct Node对象,然后就死循环了;

上述代码正确吗?如果正确,那 sizeof(struct Node) 是多少? 仔细分析,其实是不⾏的,因为⼀个结构体中再包含⼀个同类型的结构体变量,这样结构体变量的⼤ ⼩就会⽆穷的⼤,是不合理的。正确的⾃引⽤⽅式:

struct Node
{
 	int data;
    struct Node* next;
};

在结构体⾃引⽤使⽤的过程中,夹杂了 typedef 对匿名结构体类型重命名,也容易引⼊问题,看看 下⾯的代码,可⾏吗?

typedef struct
{
	int data;
	Node* next;
}Node;

答案是不⾏的,因为Node是对前⾯的匿名结构体类型的重命名产⽣的,但是在匿名结构体内部提前使 ⽤Node类型来创建成员变量,这是不⾏的。

解决⽅案如下:定义结构体不要使⽤匿名结构体了

typedef struct Node
{
	int data;
	struct Node* next;
}Node;

5 结构体内存对⻬

对⻬规则

⾸先得掌握结构体的对⻬规则:

1.结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处

2.其他成员变量要对⻬到偏移量为某个数字(对⻬数)的整数倍的地址处。 对⻬数=编译器默认的⼀个对⻬数与该成员变量⼤⼩的较⼩值。 -VS 中默认的值为 8 -Linux中gcc没有默认对⻬数,对⻬数就是成员⾃⾝的⼤⼩

3.结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的 整数倍。

4.如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构 体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。

  

//练习1
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));//12
//练习2
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));//8
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));//16
//练习4-结构体嵌套问题
struct S4
{
char c1;
struct S3 s3;//按照对齐规则计算s3的大小16字节再按照对齐规则计算s4的大小
double d;
};
printf("%d\n", sizeof(struct S4));//32

      

为什么存在内存对⻬??

⼤部分的参考资料都是这样说的:

  1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。

  2. 性能原因: 数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未对⻬的内存,处理器需要 作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地 址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以 ⽤⼀个内存操作来读或者写值了。否则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两 个8字节内存块中。

  3. 总体来说:结构体的内存对⻬是拿空间来换取时间的做法。 那在设计结构体的时候,我们既要满⾜对⻬,⼜要节省空间,如何做到: 让占⽤空间⼩的成员尽量集中在⼀起 //例如:

struct S1
{
	char c1;
	int i;
	char c2;
};
struct S2
{
	char c1;
	char c2;
	int i;
};

S1 和 S2 类型的成员⼀模⼀样,但是 S1 和 S2 所占空间的⼤⼩有了⼀些区别。

修改默认对⻬数

#include <stdio.h>
#pragma pack(1) //设置默认对⻬数为1
struct S
{
	char c1;
	int i;
	char c2;
};
#pragma pack() //取消设置的对⻬数,还原为默认
int main()
{
	//输出的结果是什么?
	printf("%d\n", sizeof(struct S));
	return 0;
}
//结构体在对⻬⽅式不合适的时候,我们可以⾃⼰更改默认对⻬数。

6 结构体传参问题--优先传地址

struct S
{
int data[1000];
int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{

 	print1(s); //传结构体
	print2(&s); //传地址
	return 0;
}

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递⼀个结构体对象的时候,结构体过⼤,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。 结论: 结构体传参的时候,要传结构体的地址。

7 结构体实现位段

什么是位段? 位段的声明和结构是类似的,有两个不同:

  1. 位段的成员必须是 int、unsigned int 或signed int ,在C99中位段成员的类型也可以 选择其他类型。

  2. 位段的成员名后边有⼀个冒号和⼀个数字。 ⽐如:

struct A
{
	int _a:2;
	int _b:5;
	int _c:10;
	int _d:30;
};
printf("%d\n", sizeof(struct A));//8 _a,_b,_c加起来17个比特位,_d需要30个比特位
//int-32比特位,除去 _a,_b,_c 17个比特位还剩15个比特位不够_d所需的比特位,所以再申请一个int的空间即32个比特位分配给_b 30比特位

A就是⼀个位段类型。 那位段A所占内存的⼤⼩是多少?

位段的内存分配

  1. 位段的成员可以是 int unsigned int signed int 或者是 char 等类型

  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的⽅式来开辟的。

  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使⽤位段。

//⼀个例⼦
struct S
{
char a:3;//使用char类型的前3个比特位
char b:4;//从剩下的五个比特位中使用四个
char c:5;//剩下一个比特位不够,再申请一个char的空间,使用五个比特位
char d:4;//剩下三个比特位也不够再申请一个char空间使用4个比特位
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的?

注意点-所有的的位段成员的类型必须都一样

位段的跨平台问题

  1. int位段被当成有符号数还是⽆符号数是不确定的。

  2. 位段中最⼤位的数⽬不能确定。(16位机器最⼤16,32位机器最⼤32,写成27,在16位机器会 出问题。

  3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。

  4. 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,是舍弃 剩余的位还是利⽤,这是不确定的。 总结: 跟结构相⽐,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

位段使⽤的注意事项

位段的⼏个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的。所以不能对位段的成员⽤&操作符,这样就不能使⽤scanf直接给位段的成员输⼊值,只能是先输⼊放在⼀个变量中,然后赋值给位段的成员。

struct A
{
 	int _a : 2;
	int _b : 5;
	int _c : 10;
	int _d : 30;
};
int main()
{
	struct A sa = {0};
	scanf("%d", &sa._b); //这是错误的
	//正确的⽰范
	int b = 0;
	scanf("%d", &b);
	sa._b = b;
	return 0;
}

能看到这里你已经超越百分之90的人了,如果对你学习C语言有所帮助,动动小手给个赞吧。


网站公告

今日签到

点亮在社区的每一天
去签到