C语言深度剖析：数据在内存中的存储-EW帮帮网

C语言深度剖析：数据在内存中的存储

一、大小端模式：多字节数据在内存中的存储顺序

在计算机系统中，大小端模式（Big-Endian 和 Little-Endian）是指多字节数据在内存中的存储顺序。理解大小端模式对跨平台开发、数据传输以及性能优化都非常重要。

1. 什么是大小端？

假设有一个32位整数 0x12345678，它的二进制表示为：

0x12345678 = 0001 0010 0011 0100 0101 0110 0111 1000

由于整数占4字节（32位），我们需要将它依次存储在内存的不同地址上。那么：

大端模式（Big Endian）：高字节存储在低地址处。
小端模式（Little Endian）：低字节存储在低地址处。

内存存储示例

假设变量 x 值为 0x12345678，存储从地址 0x1000 开始：

大端模式（Big Endian）：

地址      数据
0x1000    0x12
0x1001    0x34
0x1002    0x56
0x1003    0x78

小端模式（Little Endian）：

地址      数据
0x1000    0x78
0x1001    0x56
0x1002    0x34
0x1003    0x12

2. 为什么会有大小端模式？

(1) 硬件架构的差异

小端模式最早由Intel处理器采用，主要用于x86架构（如PC）。
大端模式通常由一些大数据服务器、网络协议、以及Motorola等处理器使用。

不同的计算机体系结构决定了如何在内存中存储数据。随着时间推移，不同厂商选择了不同的模式，因此世界上存在大端和小端的混用。

(2) 历史原因

大端模式类似于人类的阅读习惯（从左到右、高位到低位），因此一些早期计算机系统（如 Motorola 68000 系列）采用大端存储。
小端模式在处理运算时更高效，尤其是在加载和解析多字节数据时表现更好。因此，Intel 系列的处理器普遍采用了小端模式。

3. 大小端的作用与意义

(1) 数据传输中的一致性

网络协议通常采用大端模式，又称网络字节序（Network Byte Order），以确保不同系统之间数据传输的一致性。常见的网络协议如TCP/IP都规定多字节整数采用大端格式。

(2) 提高数据处理效率

小端模式在处理器加载字节时有优势：可以直接取低地址开始的字节，而不用调整数据顺序。这使得小端模式在一些低级硬件操作中效率更高。
例如，在取出一个16位数据的低8位时，小端模式不需要额外的字节偏移计算。

4. 大小端检测及应用

如何检测系统的大小端模式？

可以通过代码检测当前系统的字节序：

#include <stdio.h>

int main() {
    unsigned int x = 0x12345678;
  	// 将整数 x 的地址转化为字符指针 p，只访问最低地址字节。
    unsigned char *p = (unsigned char *)&x;
		// 如果最低地址字节是0x78，说明系统是小端模式；否则为大端模式。
    if (*p == 0x78) {
        printf("小端模式\n");
    } else {
        printf("大端模式\n");
    }
    return 0;
}

5. 大小端转换

在跨平台开发或网络数据传输中，经常需要在大小端之间转换数据。C语言提供了一些函数来处理字节序问题：

#include <arpa/inet.h> // 包含网络字节序转换函数

int main() {
    unsigned int host_num = 0x12345678;

    // 主机字节序转换为网络字节序（大端）
    unsigned int net_num = htonl(host_num);

    printf("网络字节序：0x%x\n", net_num);
    return 0;
}

htonl：将主机字节序转换为网络字节序（大端）。
ntohl：将网络字节序（大端）转换为主机字节序。

6. 大小端对性能的影响

小端模式的优势：
1. 加载和存储高效：取低字节时无需偏移操作。
2. 适合小数据类型的运算：如16位或8位的数据操作。
大端模式的优势：
1. 易于人类理解：高位字节放在低地址，类似于我们平时的书写习惯。
2. 适合网络传输：保证数据传输时的字节序一致性。

二、整数类型的存储详解

1. 有符号整数（`signed int`）

大小：通常为4字节（32位），不同平台可能存在差异（如16位、64位系统）。
范围：
- 最大值： $2^{31} - 1 = 2,147,483,647$
- 最小值： $2^{31} = -2,147,483,648$
存储方式：使用二进制补码（Two’s Complement）。

二进制补码表示法

补码是一种处理有符号数的二进制表示法，使计算机可以用相同的电路进行加法和减法运算。

正数的补码

表示：正数的补码与其原码（直接的二进制表示）相同。
高位补0：符号位（最高位）为0，表示正数。

示例：+5的32位二进制表示：

00000000 00000000 00000000 00000101

负数的补码计算

取绝对值的二进制表示。
按位取反（0变1，1变0）。
加1，得到最终的补码。

示例：存储`-5`的32位二进制补码

绝对值的二进制形式（+5的二进制表示）：
```
00000000 00000000 00000000 00000101
```
按位取反：
```
11111111 11111111 11111111 11111010
```
加1：
```
11111111 11111111 11111111 11111011
```

因此，-5的32位二进制补码表示为：

11111111 11111111 11111111 11111011

负数的解码

如果我们看到补码 11111111 11111111 11111111 11111011，如何解码？

按位取反：
```
00000000 00000000 00000000 00000100
```
加1：
```
00000000 00000000 00000000 00000101
```
符号为负：结果为-5。

补码的优势

统一加减法：补码让加法和减法共用同一电路。例如：
```
5 + (-5) = 0
```
避免二义性：不存在+0和-0的歧义。
简化溢出处理：整数溢出时自动环绕。

示例：溢出

int a = 2147483647;  // 最大int值
a = a + 1;  // 溢出
printf("%d\n", a);  // 输出-2147483648

2. 无符号整数（`unsigned int`）

大小：通常为4字节（32位）。
表示范围：0 到 $2^{32} - 1$ 。
- 最大值：4,294,967,295
- 最小值：0
存储方式：直接使用二进制表示，不包含符号位。

无符号整数的存储

无符号整数将32位全部用于表示数值，不涉及符号。

示例：5的32位无符号二进制表示：

00000000 00000000 00000000 00000101

运算与溢出

由于无符号整数的表示范围是0到 $2^{32} - 1$ ，在发生溢出时，结果将环绕到0。

示例：无符号整数溢出

unsigned int b = 4294967295;  // 最大值
b = b + 1;  // 溢出
printf("%u\n", b);  // 输出0

3. 有符号与无符号的区别

符号位：
- 有符号整数使用最高位表示符号（0为正，1为负）。
- 无符号整数没有符号位。
范围：
- 有符号整数范围： $2^{31}$ 到 $2^{31} - 1$ 。
- 无符号整数范围：0 到 $2^{32} - 1$ 。
溢出处理：
- 有符号整数：溢出时会从最小负数环绕。
- 无符号整数：溢出时会从0环绕。

4. 注意事项：有符号和无符号混用

C语言允许有符号和无符号整数混合运算，但可能产生意外结果。例如：

int a = -1;
unsigned int b = 1;

if (a > b) {
    printf("a > b\n");
} else {
    printf("a <= b\n");
}

在这段代码中，a被解释为无符号整数，即4294967295，所以输出为：

a > b

三、浮点数的存储

在C语言中，float和double类型用于表示带小数点的数值。它们通常遵循IEEE 754标准，这是一种广泛应用的浮点数表示规范。理解浮点数的存储方式对于数值计算的准确性和性能优化至关重要。

1. IEEE 754标准

IEEE 754标准定义了浮点数的表示和运算方式，旨在提供一种统一且高效的浮点数处理方法。该标准主要包括单精度和双精度两种格式，分别对应C语言中的float和double类型。

单精度浮点数（`float`）

大小：4字节（32位）。
结构：
- 符号位（S）：1位。
- 指数位（E）：8位。
- 尾数位（M）：23位。

双精度浮点数（`double`）

大小：8字节（64位）。
结构：
- 符号位（S）：1位。
- 指数位（E）：11位。
- 尾数位（M）：52位。

2. 存储方式

IEEE 754标准通过符号位、指数位和尾数位的组合来表示浮点数。这种表示方式允许浮点数覆盖广泛的数值范围，同时保持较高的精度。

符号位（S）

位置：最高位（最左侧的一位）。
含义：
- 0：表示正数。
- 1：表示负数。

指数位（E）

作用：表示浮点数的指数部分，采用偏移（偏置）表示法。
偏移量：
- 单精度：127。
- 双精度：1023。
计算公式：实际指数 = 存储的指数 - 偏移量。

例如，单精度中存储的指数为130，则实际指数为：
```
实际指数 = 130 - 127 = 3
```

尾数位（M）

作用：表示浮点数的有效数字部分，也称为尾数或小数部分。
隐含位：
- 规范化数：隐含最高位为1，不在存储中表示。
- 非规范化数（Denormalized Numbers）：隐含最高位为0，用于表示非常接近零的数值。
实际表示：
- 规范化数：1.M
- 非规范化数：0.M

3. 存储示例

通过一个具体的例子，我们将详细解析如何将一个浮点数存储为二进制形式。

存储`-15.375`的单精度浮点数

步骤1：转换为二进制

整数部分：15 → 1111
小数部分：0.375 → 0.011

合并：
```
15.375 = 1111.011（二进制）
```

步骤2：规范化

将二进制数表示为科学计数法的形式：

1111.011 = 1.111011 × 2^3

步骤3：确定符号位（S）

由于数值为负数，符号位为1。

S = 1

步骤4：计算指数位（E）

实际指数：3
偏移量（单精度）：127

存储的指数 = 3 + 127 = 130

二进制表示：

130 = 10000010（二进制）

E = 10000010

步骤5：确定尾数位（M）

规范化尾数：1.111011
存储尾数：去掉隐含的1，只存储小数部分111011，并补足23位。

M = 11101100000000000000000

步骤6：最终存储

将符号位、指数位和尾数位组合起来：

S	E	M
1	10000010	11101100000000000000000

完整的32位二进制表示

1 10000010 11101100000000000000000

十六进制表示：C170C000（根据具体存储方式可能有所不同）

内存排列：

小端模式：

地址	数据
0x1000	11101100
0x1001	00000000
0x1002	10000010
0x1003	10000001

大端模式：

地址	数据
0x1000	10000001
0x1001	10000010
0x1002	00000000
0x1003	11101100

4. 特殊值的表示

IEEE 754标准不仅定义了规范化的浮点数表示，还包括一些特殊值，用于处理特定的数值情况。

正零和负零

正零：

S = 0
E = 00000000
M = 00000000000000000000000

负零：

S = 1
E = 00000000
M = 00000000000000000000000

注意：正零和负零在数值上相等，但在某些运算中可能表现出不同的行为。

无穷大（Infinity）

正无穷大：

S = 0
E = 11111111
M = 00000000000000000000000

负无穷大：

S = 1
E = 11111111
M = 00000000000000000000000

用途：表示超出可表示范围的数值，如溢出运算结果。

非数（NaN - Not a Number）

表示：

E = 11111111
M ≠ 00000000000000000000000

用途：表示未定义或不可表示的数值结果，如0/0或∞ - ∞。

类型：

Quiet NaN：不引发异常，直接传播。
Signaling NaN：触发异常或错误处理。

非规范化数（Denormalized Numbers）

表示：

E = 00000000
M ≠ 00000000000000000000000

特点：
- 没有隐含的1，尾数以0.M表示。
- 用于表示非常接近零的数值，扩大浮点数的表示范围。

5. 浮点数的精度与舍入

浮点数的表示方式导致了有限的精度和可能的舍入误差，这是计算机数值运算中的常见问题。

精度

单精度（float）：
- 有效位数：约6-7位十进制数。
- 精度限制：无法精确表示超过有效位数的数值。
双精度（double）：
- 有效位数：约15-16位十进制数。
- 精度更高，适用于需要高精度计算的场景。

舍入模式

在浮点数运算中，由于尾数位的有限性，某些运算结果无法精确表示。这时需要采用舍入（Rounding）策略，将结果四舍五入到最接近的可表示数值。IEEE 754标准定义了多种舍入模式，以下是常用的四种舍入模式：

最近偶数舍入（Round to Nearest, ties to even）

定义：这是默认的舍入模式。在这种模式下，数值被舍入到最接近的可表示数。如果一个数位于两个可表示数的中间（即“平局”），则舍入到偶数的一边。
特点：
- 减少偏差：通过将平局情况舍入到偶数，能够在大量运算中减少系统性的舍入误差。
- 平衡舍入方向：避免总是向上或向下舍入，保持舍入的中性。
示例：
- 例1：2.5 舍入到最近的整数是 2（偶数）。
- 例2：3.5 舍入到最近的整数是 4（偶数）。

向零舍入（Round toward Zero）

定义：在这种模式下，数值被截断到最接近的可表示数，不管符号如何。即，舍入方向总是趋向于零。
特点：
- 简单实现：直接截断尾数，易于硬件实现。
- 消除小数部分：适用于需要忽略小数部分的场景。
示例：
- 3.7 舍入为 3
- -2.9 舍入为 -2

向正无穷舍入（Round toward +∞）

定义：在这种模式下，数值被舍入到大于或等于原始数值的最接近可表示数。即，所有舍入操作都向正无穷方向进行。
特点：
- 确保不小于原值：适用于需要保证结果不低于某个阈值的场景，如金融计算中的利息计算。
- 单向舍入：所有正数向上舍入，负数向下舍入（即更接近零）。
示例：
- 3.1 舍入为 4
- -2.1 舍入为 -2

向负无穷舍入（Round toward -∞）

定义：在这种模式下，数值被舍入到小于或等于原始数值的最接近可表示数。即，所有舍入操作都向负无穷方向进行。
特点：
- 确保不大于原值：适用于需要保证结果不超过某个阈值的场景，如价格下限计算。
- 单向舍入：所有正数向下舍入（即更接近零），负数向上舍入。
示例：
- 3.9 舍入为 3
- -2.3 舍入为 -3

舍入模式的选择与应用

选择合适的舍入模式取决于具体的应用需求：

最近偶数舍入：适用于大多数科学计算和数值分析，因其能够平衡舍入误差。
向零舍入：适用于需要截断小数部分的场景，如整数转换或特定的金融计算。
向正无穷舍入：适用于需要确保结果不低于某个值的场景，如保守估计或某些保险计算。
向负无穷舍入：适用于需要确保结果不超过某个值的场景，如预算控制或价格下限设定。

示例代码：不同舍入模式的实现

虽然C语言本身不直接支持所有舍入模式，但可以通过数学函数和逻辑操作来实现部分舍入模式：

#include <stdio.h>
#include <math.h>

// 向零舍入
double round_toward_zero(double x) {
    return (x > 0) ? floor(x) : ceil(x);
}

// 向正无穷舍入
double round_toward_pos_inf(double x) {
    return ceil(x);
}

// 向负无穷舍入
double round_toward_neg_inf(double x) {
    return floor(x);
}

int main() {
    double num1 = 3.5;
    double num2 = -2.5;

    // 最近偶数舍入使用标准round函数
    printf("Round to Nearest (%.1f) = %.1f\n", num1, round(num1));
    printf("Round to Nearest (%.1f) = %.1f\n", num2, round(num2));

    // 向零舍入
    printf("Round toward Zero (%.1f) = %.1f\n", num1, round_toward_zero(num1));
    printf("Round toward Zero (%.1f) = %.1f\n", num2, round_toward_zero(num2));

    // 向正无穷舍入
    printf("Round toward +∞ (%.1f) = %.1f\n", num1, round_toward_pos_inf(num1));
    printf("Round toward +∞ (%.1f) = %.1f\n", num2, round_toward_pos_inf(num2));

    // 向负无穷舍入
    printf("Round toward -∞ (%.1f) = %.1f\n", num1, round_toward_neg_inf(num1));
    printf("Round toward -∞ (%.1f) = %.1f\n", num2, round_toward_neg_inf(num2));

    return 0;
}

输出：

Round to Nearest (3.5) = 4.0
Round to Nearest (-2.5) = -2.0
Round toward Zero (3.5) = 3.0
Round toward Zero (-2.5) = -2.0
Round toward +∞ (3.5) = 4.0
Round toward +∞ (-2.5) = -2.0
Round toward -∞ (3.5) = 3.0
Round toward -∞ (-2.5) = -3.0

浮点数的误差

由于有限的尾数位，某些十进制数无法精确表示为二进制浮点数，导致近似误差。

常见问题：

精度丢失：如0.1无法精确表示，实际存储为0.10000000149011612。
累积误差：在多次运算中，误差可能累积，影响结果的准确性。

解决方法：

避免直接比较浮点数：使用误差范围进行比较。

#define EPSILON 1e-6

if (fabs(a - b) < EPSILON) {
    // a 和 b 认为相等
}

使用高精度类型：如double或long double，以减少误差。

6. 浮点数运算中的特殊情况

处理无穷大和NaN

在浮点数运算中，可能会出现无穷大和NaN，需要特别处理以避免程序崩溃或产生不正确的结果。

示例：

#include <stdio.h>
#include <math.h>

int main() {
    float a = 1.0f / 0.0f; // 正无穷大
    float b = -1.0f / 0.0f; // 负无穷大
    float c = 0.0f / 0.0f; // NaN

    printf("a = %f\n", a); // 输出 inf
    printf("b = %f\n", b); // 输出 -inf
    printf("c = %f\n", c); // 输出 nan

    // 检测是否为NaN
    if (isnan(c)) {
        printf("c 是 NaN\n");
    }

    // 检测是否为无穷大
    if (isinf(a)) {
        printf("a 是无穷大\n");
    }

    return 0;
}

输出：

a = inf
b = -inf
c = nan
c 是 NaN
a 是无穷大

比较浮点数

由于浮点数的精度限制，直接比较可能导致意外结果。应使用容差范围进行比较。

#include <stdio.h>
#include <math.h>

#define EPSILON 1e-6

int main() {
    float x = 0.1f * 3;
    float y = 0.3f;

    if (fabs(x - y) < EPSILON) {
        printf("x 和 y 相等\n");
    } else {
        printf("x 和 y 不相等\n");
    }

    return 0;
}

输出：

x 和 y 相等

四、指针的底层存储

1. 指针的基本概念

指针（Pointer）是C语言中一个特殊的变量，用于存储内存地址。指针使得程序能够直接访问和操作内存中的数据，是实现动态内存管理和数据结构（如链表、树、图）操作的关键。

2. 指针的大小和类型依赖性

指针大小：
- 32位系统：指针大小为4字节（32位）。
- 64位系统：指针大小为8字节（64位）。
指针类型：
- 指针类型决定了指针指向的数据类型。例如，int*指向int类型，char*指向char类型。
- 不同类型的指针在运算时具有不同的步长。

3. 指针的表示方式

指针存储的是一个内存地址，通常被解释为无符号整数。指针类型决定了如何解读和操作该内存地址处的数据。

示例：

#include <stdio.h>

int main() {
    int a = 10;
    int *ptr = &a;

    printf("变量a的地址：%p\n", (void*)&a);
    printf("指针ptr的值（a的地址）：%p\n", (void*)ptr);
    printf("指针ptr指向的值：%d\n", *ptr);

    return 0;
}

输出（地址因系统而异）：

变量a的地址：0x7ffdfc1c6c3c
指针ptr的值（a的地址）：0x7ffdfc1c6c3c
指针ptr指向的值：10

4. 指针与内存地址

指针变量本身存储在内存中，有其自己的内存地址。例如：

#include <stdio.h>

int main() {
    int a = 10;
    int *ptr = &a;

    printf("变量a的地址：%p\n", (void*)&a);
    printf("指针ptr的地址：%p\n", (void*)&ptr);
    printf("指针ptr的值（a的地址）：%p\n", (void*)ptr);

    return 0;
}

输出（地址因系统而异）：

变量a的地址：0x7ffdfc1c6c3c
指针ptr的地址：0x7ffdfc1c6c40
指针ptr的值（a的地址）：0x7ffdfc1c6c3c

分析：

&a：获取变量a的内存地址。
&ptr：获取指针变量ptr本身的内存地址。
ptr：指针变量存储的值，即a的地址。

5. 指针运算的底层机制

指针运算允许在数组或动态内存中遍历数据。指针加减运算的步长由指针类型决定。

示例：

#include <stdio.h>

int main() {
    int arr[5] = {10, 20, 30, 40, 50};
    int *ptr = arr; // 等价于 int *ptr = &arr[0];

    for (int i = 0; i < 5; i++) {
        printf("arr[%d] = %d\n", i, *(ptr + i));
    }

    return 0;
}

输出：

arr[0] = 10
arr[1] = 20
arr[2] = 30
arr[3] = 40
arr[4] = 50

分析：

ptr + i：指针加上i，实际内存地址为ptr加上i * sizeof(int)。
*(ptr + i)：解引用指针，获取第i个元素的值。

6. 函数指针的存储与使用

函数指针用于存储函数的地址，可以实现回调函数、多态等功能。

示例：

#include <stdio.h>

// 定义一个函数
void greet() {
    printf("Hello, World!\n");
}

int main() {
    // 定义函数指针
    void (*funcPtr)() = greet;

    // 使用函数指针调用函数
    funcPtr(); // 输出：Hello, World!

    return 0;
}

分析：

void (*funcPtr)()：定义一个指向无参数、无返回值函数的指针。
funcPtr = greet：将函数greet的地址赋给funcPtr。
funcPtr()：调用通过指针指向的函数。

五、联合体（Union）的存储

1. 联合体的定义与用途

联合体（Union）是一种特殊的结构体，所有成员共享同一段内存。联合体的大小等于其最大成员的大小。联合体用于在同一内存位置存储不同类型的数据，实现类型之间的快速转换或节省内存空间。

2. 联合体的存储结构

在联合体中，所有成员共享同一段内存，因此修改一个成员会影响其他成员的值。联合体的成员通常用于表示同一数据的不同视图。

示例：

#include <stdio.h>

union Data {
    int i;
    float f;
    char bytes[4];
};

int main() {
    union Data data;

    data.i = 5;
    printf("data.i = %d\n", data.i);
    printf("data.f = %f\n", data.f);
    printf("data.bytes = %02x %02x %02x %02x\n", data.bytes[0], data.bytes[1], data.bytes[2], data.bytes[3]);

    data.f = 3.14f;
    printf("data.i = %d\n", data.i);
    printf("data.f = %f\n", data.f);
    printf("data.bytes = %02x %02x %02x %02x\n", data.bytes[0], data.bytes[1], data.bytes[2], data.bytes[3]);

    return 0;
}

输出（可能因系统字节序而异）：

data.i = 5
data.f = 0.000000
data.bytes = 05 00 00 00
data.i = 1078523331
data.f = 3.140000
data.bytes = c3 f5 48 40

分析：

data.i = 5：
- 内存：0x05 0x00 0x00 0x00（小端模式）
- data.f：0.0（因为字节解释为浮点数）
data.f = 3.14f：
- 内存：0xc3 0xf5 0x48 0x40（小端模式）
- data.i：1078523331（对应的二进制解释）

3. 联合体的大小与成员

联合体的大小由其最大成员决定。其他成员共享同一内存区域，任何一个成员的修改都会影响整个联合体的内容。

示例：

#include <stdio.h>

union MixedUnion {
    char c;      // 1字节
    int i;       // 4字节
    double d;    // 8字节
};

int main() {
    union MixedUnion mu;
    printf("联合体大小：%zu 字节\n", sizeof(mu));
    return 0;
}

输出：

联合体大小：8 字节

分析：

成员c：1字节
成员i：4字节
成员d：8字节
联合体大小：8字节（由double决定）

4. 联合体的应用场景

类型转换：

通过联合体，可以在不同数据类型之间快速转换，常用于浮点数与整数之间的位级转换。

示例：

#include <stdio.h>

union Converter {
    float f;
    unsigned int i;
};

int main() {
    union Converter conv;
    conv.f = 3.14f;
    printf("float: %f, as int: %u\n", conv.f, conv.i);
    return 0;
}

节省内存：
- 在嵌入式系统或内存受限的环境中，使用联合体可以节省内存空间。
访问硬件寄存器：
- 联合体可用于定义硬件寄存器的不同视图，如位域和整型视图。

5. 联合体的示例

示例1：浮点数与整数的转换

#include <stdio.h>

union FloatIntUnion {
    float f;
    int i;
};

int main() {
    union FloatIntUnion u;
    u.f = 3.14f;
    printf("Float: %f\n", u.f);
    printf("As integer: %d\n", u.i);
    return 0;
}

输出：

Float: 3.140000
As integer: 1078523331

分析：

u.f = 3.14f：将浮点数3.14存储到联合体中。
u.i：通过整数视图读取相同的内存内容，得到其二进制位对应的整数值。

示例2：硬件寄存器的位操作

#include <stdio.h>

struct RegisterBits {
    unsigned int flag1 : 1;
    unsigned int flag2 : 1;
    unsigned int mode  : 2;
    unsigned int value : 28;
};

union HardwareRegister {
    struct RegisterBits bits;
    unsigned int raw;
};

int main() {
    union HardwareRegister reg;
    reg.raw = 0;

    reg.bits.flag1 = 1;
    reg.bits.flag2 = 0;
    reg.bits.mode = 3;
    reg.bits.value = 123456;

    printf("Register raw value: %u\n", reg.raw);
    printf("flag1: %u, flag2: %u, mode: %u, value: %u\n",
           reg.bits.flag1, reg.bits.flag2, reg.bits.mode, reg.bits.value);

    return 0;
}

输出：

Register raw value: 12345613
flag1: 1, flag2: 0, mode: 3, value: 123456

分析：

HardwareRegister：联合体包含位域视图和原始整数视图。
设置位域：通过reg.bits设置不同的标志位和模式。
读取原始值：通过reg.raw读取整个寄存器的原始值。

6. 联合体的大小与对齐

联合体的大小由其最大成员决定，并且遵循相应的对齐规则。

示例：

#include <stdio.h>

union SampleUnion {
    char c;      // 1字节
    int i;       // 4字节
    double d;    // 8字节
};

int main() {
    printf("联合体大小：%zu 字节\n", sizeof(union SampleUnion));
    return 0;
}

输出：

联合体大小：8 字节

分析：

成员d：8字节，最大成员决定联合体大小为8字节。
对齐：联合体整体对齐要求与其最大成员一致（通常为8字节）。

7. 联合体的优势与限制

优势：

节省内存：不同成员共享同一内存区域，减少内存占用。
灵活性：能够以不同类型访问相同的数据，适用于多种用途。

限制：

类型安全：访问未定义成员可能导致数据解释错误，容易引发未定义行为。
移植性：不同平台和编译器对联合体成员的存储顺序可能不同，影响移植性。
不能同时存储多个成员：一次只能有效存储一个成员的数据，修改一个成员会影响其他成员。

C语言深度剖析：数据在内存中的存储