文章下方附学习资源,自助领取
通信过程中一般都会有包长、数据缓冲等等信息;而实际场景中,数据包长度是不确定的,使用数组的定长包或者指针数据包都有一定的缺陷。那么,可变长的数据缓存方法有吗?
答案是有的,这就是0长度数组,又称为柔性数组(flexible array),通常用来实现变长数组。
变长数组简介
变长数组是数组大小待定的数组,C语言中结构体的最后一个元素可以是大小未知的数组,也就是所谓的0长度。
在标准C/C++中,不允许用0长度数组,但在GNU C中,却可以定义0长度数组(在C99之前写成长度为0,C99中可以直接不写索引),我们可以用结构体来创建变长数组。
typedef struct {
int len;
int array[0];//int array[];
}SoftArray;
它的主要用途是为了满足需要变长度的结构体,为了解决使用数组时内存的冗余和数组的越界问题。
sizeof(SoftArray);
的值在32位操作系统下刚好为4,也就是一个int型变量大小,这说明结构体中的数组没有占用内存。
对于编译器来说,此时长度为0的数组并不占用空间,因为数组名本身不占空间,它只是一个偏移量,数组名这个符号本身代表了一个不可修改的地址常量 (注意:数组名永远都不会是指针)。
对于这个数组的大小,我们可以进行动态分配。
对于变长数组的这个特点,很容易构造出变成结构体,如缓冲区、数据包等等。
变长度数组的优缺点
这次的通信协议项目,假如使用数组来传递数据,那么一般定义如下,其中包的长度maxLen是一个定值,假设为1024。
typedef struct {
int len;
int array[maxLen];
}SoftArray;
这包数据的大小为sizeof(int) + sizeof(int) * maxLen
,由于考虑到数据的溢出,maxLen一般会设置得足够长足以容纳最大的数据。因此,数组很多情况下可能都没有填满数据,造成了浪费。
而使用指针的话,则定义如下:
typedef struct
{
int len;
char *array;
};
数据结构的大小为sizeof(int) + sizeof(int *)
,使用指针结果作为缓冲区,只多使用了一个指针大小的空间,不会造成空间的大量浪费,但需要额外开辟和释放数据域的空间,我们并不能假定使用者了解我们开辟的细节,并按照约定的操作释放空间,因此使用起来多有不便,甚至造成内存泄漏。
变成数组可以节约空间,解决使用数组时内存的冗余和数组的越界问题。但也有一个缺点,那就是结构体中的变长数组只能放在最后面。
typedef struct {
int len;
int array[];
int CRC;
}SoftArray;
这种用法是不行的,不支持,会报以下错误,如果后续要加上一些其他的数据就不能用了。
其实柔性数组成员在实现跳跃表时有它特别的用法,在Redis的SDS数据结构中和跳跃表的实现上,也使用柔性数组成员。
嵌入式物联网需要学的东西真的非常多,不少人因为学的路线不对、内容不对头而和高薪offer插肩而过,甚至有些老铁压根都不知道要学什么……让人捉急……
分享一波自己整理的学习资源吧,基本上要学的内容都有,150多G。无偿
资料获取神秘渠道【C语言/C++编程学习基地】:
点击这里找小助理免费领取https://jq.qq.com/?_wv=1027&k=GbZsM924
为什么0长度数组不占用存储空间
由于0长度数组是GNU C的扩展,有一些巧妙编写的诡异代码,其执行结果就是依赖于编译器和优化策略的实现的,我们来看看以下代码:
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
char a[0];
printf("%p\n", a);
char b[0];
printf("%p\n", b);
const char *c= "Hello";
printf("%p\n", c);
const char *d = "Hello";
printf("%p\n", d);
return EXIT_SUCCESS;
}
编译结果是:
可以看到a和b的地址就会被编译器优化到一处,因为a[0] 和 b[0] 对于程序来说是无法使用的,同样编译器对于相同字符串常量,往往地址也是优化到一处,减少空间占用。
所以其本质上涉及到的是一个C语言里面的数组和指针的区别问题,Programming Abstractions in C
一书中提到:
“arr is defined to be identical to &arr[0]”.
也就是说,char a[1]
里面的a实际是一个常量,即a = &a[0]
。而char *b
是有一个实实在在的指针变量b存在。所以,a=b
是不允许的,而b=a
是允许的。
#include <stdio.h>
char a[1];
char *b;
int main () {
b = a;
//a=b会报错,incompatible types when assigning to type ‘char[1]’ from type ‘char *’
a = b;
return 0;
}
两种变量都支持下标式的访问,那么对于a[0]和b[0]
本质上是否有区别?我们可以通过一个例子来说明。
变长数组和动态数组有什么区别?
动态数组是指在声明时,没有确定数组大小的数组,它可以随程序需要而重新指定大小。动态数组的内存空间是从堆动态分配的,当程序执行到我们编写的分配语句时,才为其分配存储空间。
使用动态数组的优点是可以根据用户需要,有效利用存储空间。
int a[10];//静态数组,在堆栈上创建
int n;
//C语言的malloc函数进行书写
int *p = (int *)malloc(n * sizeof(int));
变长数组的实际意思是以变量作为长度的数组
,区别于以常数作为长度的数组
。英文Variable-Length Array
(后续都缩写成VLA),注意这里有一个连接号。
连接号-
代表的意思是,Variable不是一个用于修饰Length的形容词,而是一个名字名词(即变量的意思)。
了解了正确的含义后,不难理解VLA的目的就是数组的长度是由一个变量指定的,而非常数。
小结
实际工程中不推荐使用VLA,程序中栈的大小是有限的,若需要的数组长度很大,有造成爆栈的危险。
作者:李逍遥 来源:技术让梦想更伟大
本文转载自“嵌入式微处理器”,如有侵权,请联系删除
原文链接:详解C语言变长数组