c++ 中 struct 的内存布局

c/c++

浏览数:682

2019-3-30

C++ or C

本文讨论的是 C++, 在C中内存布局差不多,但也不尽相同。如一个空的struct,c++中大小为1, C中却大小为0.

struct 的最小大小为1

C++中每个对象必须有个唯一的地址,所以每个对象的大小必须不能为0。因此一个 struct 的最小大小为 1. 一个例子是一个空struct:

struct EmptyStruct {};
// sizeof (EmptyStruct) = 1

内存布局流程

一个 struct 的内存布局流程可以简化为下面几步:

  1. struct 放到地址0上
  2. struct 的所有成员顺序地依次放置到自己的偏移位置上
  3. 所有成员放置完毕,对struct的内容大小(最后一个成员的终了位置)进行对齐,计算出新大小

流程中涉及到两点:

  1. 如何确定一个成员的放置起始位置
  2. 如何最后对struct的内容大小进行对齐

成员的起始位置

当放置完上一个成员之后,对接下来的成员放置位置是有要求的,要求这个位置偏移(对于struct的起始位置)必须是这个成员的内部最大pod类型的大小的倍数

成员的内部最大pod类型可以分成几种情况来讨论:

  • 第一种是这个成员就是基本的pod类型(int,char,double,…) ,那么其内部最大pod类型大小自然是其本身成员的大小了。

  • 第二种是这个成员是struct类型,其内部最大pod类型为struct内部的各个成员的内部最大pod类型中最大的那个(有个递归了)。

  • 第三种是数组,数组的内存布局要求是,每个数组成员之间无空隙排列的,没有填充字节。所以数组的总大小是数组长度乘以每个数组成员的大小。内部最大pod类型的大小为数组成员内部的最大pod类型大小(有个递归了)。

伪代码如下:

// 求内部最大的成员大小
function maxInnerUnitSize(data)
    if data 是 pod类型:
         return sizeof(pod类型)
    else if data 是 struct 类型:
        return max(map(data.members, maxInnerUnitSize))
    else if data  是 数组类型:
       return maxInnerUnitSize(data[0])
end

在上个放置成员尾部和当前成员起始位置之间如果有间隙,那么编译器会填充无效字节。

然后就可以把当前成员放置进去,放入的大小为当前成员的总大小。一个成员的大小计算伪代码:

function dataSize(data)
    if data 是 pod类型:
         return sizeof(pod类型)
    else if data 是 struct 类型:
        return struct 的大小
    else if data  是 数组类型:
       return 数组长度 * sizeof(data[0])
end

struct 的大小对齐

成员都放置完毕之后,struct的内容大小有个规则,必须是内部最大pod类型的大小的倍数。没错,就是上面那个 maxInnerUnitSize。

然后在最后一个成员末尾到struct的新大小末尾会填充字节(如果有空隙的话)。

举个例子:

struct AAA {
    char a[3];
    int64_t b;
    char c;
};

首先,最大成员大小 maxInnerUnitSize 为 max(3, 8, 1) = 8, 所以每个成员的偏移位置必须是 8 的倍数。先放置 a 在 0 处,其占用 3 个字节,然后填充 5 个补齐字节,以让 b 放置在 8 处,b占用 8 个字节,最后 c 放置在 16 处,占用 1 个字节。至此整个struct内容大小为 17,所以调整到 8 的倍数,末尾填充 6 个字节,struct 大小调整为 24.

#pragma pack(n) 的影响

pack 的参数n,有1,2,4,8,16, 原则是 2 的次幂。这个参数影响的是上面流程中的内部最大pod类型大小。影响是从正常流程算出的大小,和pack(n) 指定的大小取最小值来布局。即:

maxInnerUnitSize(data) = min(maxInnerUnitSize(data), pack_n)

再看上面的例子,添加 pack(n) 后的效果:

#pragma pack(4)

struct AAA {
    char a[3];
    int64_t b;
    char c;
};

首先,最大成员大小 maxInnerUnitSize 为 max(3, 8, 1) = 8, 然后与 pack(4) 取最小徝,故每个成员的偏移位置必须是 4 的倍数。

a 放置在地址 0 处,占用 3 个字节,接下来 b 放置在地址 4 处,占用 8 个字节, c 放置在地址 12 处,占用 1 个字节。struct内容区域大小为 13 ,需要调整为 4 的倍数,所以大小调整为 16 .