C语言结构体的字节对齐

本文介绍: 本文详细介绍了C语言中结构体字节对齐的规则，并根据该规则拓展了一些CPU读取系统内存的一些知识，联系到实际开发中，鼓励读者对提高自己编程能力的思考

C语言结构体的字节对齐

什么是字节对齐

首先来看下面的程序：

#include <stdio.h>

typedef struct n1{
    int a;
    char b;
    char c; 
} N_stru1;

typedef struct n2{
    char b;
    int a;
    char c;
} N_stru2;

int main() {
    N_stru1 n1;
    N_stru2 n2;
    printf("%dn", sizeof(n1));
    printf("%dn", sizeof(n2));
    return 0;
}

两个输出的结果是什么？

如图：
在这里插入图片描述
明明结构体中的成员类型数量都是一样的，为什么会出现存储他们的结构体大小不一样的情况呢？

原因是这样的，下面是这两个结构体在内存中的存储结构：

n1：

地址	0x00	0x01	0x02	0x03	0x04	0x05	0x06	0x07
内容	a	–	–	–	b	c	/	/

n2:

地址	0x00	0x01	0x02	0x03	0x04	0x05	0x06	0x07	0x08	0x09	0x10	0x11
内容	b	/	/	/	a	–	–	–	c	/	/	/

ps：在上面的表格中，“-”表示被使用，“/”表示被空置或者跳过

通过观察表格会发现：n2这个结构体中的字节有很多的空间被浪费了（因为有更多空置的内存），所以可以得出一个结论：

C语言的编译器在给结构体分配空间时按照结构体成员的声明顺序分配，并且其空间遵循内存边界要求最严格的成员的空间大小分配空间

如果你已经明白，那么可以跳过下面这个小板块的内容，如果还是没有，我讲配合上面的例子进行说明：

编译器对于结构体成员分配结论的详细解释

上面的结论有两点：

分配空间时按照结构体成员的声明顺序分配
遵循内存边界要求最严格的成员的空间大小分配空间

第一点，观察上表：
可以发现n1中的成员从地址最低位向最高位依次是：a、b、c
而n2中的成员从地址最低位向最高位依次是：b、a、c

这个顺序和我们在程序中对结构体成员的声明顺序是相同的。

第二点：
在这个例子中，发现n1和n2的大小分别是8和12，他们都是4的倍数。
为什么要说是4的倍数呢？
因为在结构体成员中，所需空间最大的变量就是int类型，也就是4个字节，所以在这个例子中，4就是内存边界要求最严格的成员变量。
那么比4小的1个字节是不能构成分配空间的单位的，所以说，编译器会在不足边界要求的成员的内存分配中给他们填充一些空的空间，以达到最低要求。
所以在上面的例子中：
n1：

地址	0x00	0x01	0x02	0x03	0x04	0x05	0x06	0x07
内容	a	–	–	–	b	c	/	/

a是int类型，占4个字节，系统直接分配，
b是char类型，占1个字节，不足4字节，系统需要填充三个字节
c也是char类型，占1个字节，不足4字节，但由于前面有空的字节，所以直接放在空字节中，不再分配空间

n2:

地址	0x00	0x01	0x02	0x03	0x04	0x05	0x06	0x07	0x08	0x09	0x10	0x11
内容	b	/	/	/	a	–	–	–	c	/	/	/

按顺序首先分配b，是char类型，不足4，填充3个字节
然后是a，满足4，不做处理直接分配
最后是c，不足4，前面字节已经被占用，因此再填充3个字节，分配

以上是对于结论的详细描述，不懂的可以在评论区提问。

那回到正题，什么是字节对齐呢？

下面是字节对齐的几个原则：

结构体的自身对齐值是其成员中自身对齐值最大的那个值，或者是指定对齐值（如果有的话）。
结构体的大小必须是其自身对齐值的整数倍，如果不足则补齐。
结构体的每个成员必须放在其自身对齐值的整数倍的地址上，如果不够则空出一些字节。

很多文章没有提到“对齐”这个概念，这里特别做一下解释：
“成员的空间分配遵循内存边界要求最严格的成员的空间大小分配空间”
其实就是上文中结论的后半部分

这里不再对64位和32位的系统进行比较，他们都遵循上述规则。

为什么要字节对齐

首先要明确的一点就是：CPU在内存中的取值是怎么样的。

操作系统位数与信息处理

显然，如果你的电脑是64位，那么CPU最大可以一次取64位（64bit换算成字节是8字节）宽的值（在内存中），然后对他们进行处理，这意味着：系统的操作位数越高，电脑运行速度会更快，处理多信息的能力就越强。

CPU读取数据的格式

CPU在访问内存时，通常是以一个字为单位，而一个字的长度就取决于CPU的位数。在64位操作系统中，一个字通常是8字节。那么一次性在内存中可以读取的字节大小就是8个字节，很舒服的是，在x86系统架构中，内存中一个内存块（也叫缓存行）的大小就是8个字节，这也恰恰是编译器在系统中开辟内存的单位，CPU一次性就可以读取这个内存块中的所有内容。