为什么sizeof
操作员返回的结构尺寸大于结构成员的总尺寸?
为什么sizeof
操作员返回的结构尺寸大于结构成员的总尺寸?
Answers:
这是因为添加了填充以满足对齐约束。数据结构对齐会影响程序的性能和正确性:
SIGBUS
)。这是一个使用x86处理器的典型设置的示例(所有使用的32位和64位模式):
struct X
{
short s; /* 2 bytes */
/* 2 padding bytes */
int i; /* 4 bytes */
char c; /* 1 byte */
/* 3 padding bytes */
};
struct Y
{
int i; /* 4 bytes */
char c; /* 1 byte */
/* 1 padding byte */
short s; /* 2 bytes */
};
struct Z
{
int i; /* 4 bytes */
short s; /* 2 bytes */
char c; /* 1 byte */
/* 1 padding byte */
};
const int sizeX = sizeof(struct X); /* = 12 */
const int sizeY = sizeof(struct Y); /* = 8 */
const int sizeZ = sizeof(struct Z); /* = 8 */
可以通过按对齐方式对成员进行排序(按基本类型中的大小满足排序要求)来最小化结构的大小(例如结构 Z
上面示例中的)。
重要说明:C和C ++标准均声明结构对齐方式是实现定义的。因此,每个编译器可能选择不同地对齐数据,从而导致不同且不兼容的数据布局。因此,在处理将由不同编译器使用的库时,重要的是要了解编译器如何对齐数据。一些编译器具有命令行设置和/或特殊#pragma
语句来更改结构对齐设置。
包装和字节对齐,如在C FAQ描述在这里:
这是为了对齐。如果很多处理器挤满了单向,那么它们将无法访问2字节和4字节的数量(例如,整数和长整数)。
假设您具有以下结构:
struct { char a[3]; short int b; long int c; char d[3]; };
现在,您可能认为应该可以像下面这样将这种结构打包到内存中:
+-------+-------+-------+-------+ | a | b | +-------+-------+-------+-------+ | b | c | +-------+-------+-------+-------+ | c | d | +-------+-------+-------+-------+
但是,如果编译器这样安排,则在处理器上要容易得多:
+-------+-------+-------+ | a | +-------+-------+-------+ | b | +-------+-------+-------+-------+ | c | +-------+-------+-------+-------+ | d | +-------+-------+-------+
在压缩版中,请注意,您和我至少很难看到b和c字段如何环绕?简而言之,处理器也很难。因此,大多数编译器将像这样填充结构(好像带有额外的不可见字段):
+-------+-------+-------+-------+ | a | pad1 | +-------+-------+-------+-------+ | b | pad2 | +-------+-------+-------+-------+ | c | +-------+-------+-------+-------+ | d | pad3 | +-------+-------+-------+-------+
s
then &s.a == &s
和的这种类型的结构变量&s.d == &s + 12
(给出了答案中显示的对齐方式)。仅当数组具有可变大小(例如,a
声明为char a[]
而不是char a[3]
)时才存储指针,但随后必须将元素存储在其他位置。
如果您希望结构具有特定的GCC大小,请使用__attribute__((packed))
。
在Windows上,将cl.exe编译器与/ Zp选项一起使用时,可以将对齐方式设置为一个字节。
通常,CPU会更轻松地访问4(或8)的倍数的数据,具体取决于平台和编译器。
因此,这基本上是对齐的问题。
您需要有充分的理由进行更改。
这可能是由于字节对齐和填充所致,因此该结构在您的平台上显示为偶数个字节(或字)。例如,在Linux上的C中,以下3种结构:
#include "stdio.h"
struct oneInt {
int x;
};
struct twoInts {
int x;
int y;
};
struct someBits {
int x:2;
int y:6;
};
int main (int argc, char** argv) {
printf("oneInt=%zu\n",sizeof(struct oneInt));
printf("twoInts=%zu\n",sizeof(struct twoInts));
printf("someBits=%zu\n",sizeof(struct someBits));
return 0;
}
成员的大小(以字节为单位)分别为4字节(32位),8字节(2x 32位)和1字节(2 + 6位)。上面的程序(在使用gcc的Linux上)将大小打印为4、8和4-填充最后一个结构,以便它是一个单词(在我的32位平台上为4 x 8位字节)。
oneInt=4
twoInts=8
someBits=4
:2
和:6
实际上指定了2位和6位,在这种情况下不是完整的32位整数。someBits.x仅2位,只能存储4个可能的值:00、01、10和11(1、2、3和4)。这有意义吗?以下是有关此功能的文章:geeksforgeeks.org/bit-fields-c
也可以看看:
对于Microsoft Visual C:
http://msdn.microsoft.com/zh-CN/library/2e70t5y1%28v=vs.80%29.aspx
和GCC声称与Microsoft的编译器兼容。
http://gcc.gnu.org/onlinedocs/gcc/Structure_002dPacking-Pragmas.html
除了前面的答案外,请注意,无论包装如何,C ++中都没有member-order-guarantee。编译器可以(当然可以)将虚拟表指针和基本结构的成员添加到该结构中。该标准甚至无法确保虚拟表的存在(未指定虚拟机制的实现),因此可以得出这样的保证是根本不可能的。
我很确定在C中可以保证成员顺序,但是在编写跨平台或交叉编译器程序时我不会指望它。
由于所谓的堆积,结构的尺寸大于其各个部分的总和。特定处理器具有与之配合使用的首选数据大小。如果32位(4字节),大多数现代处理器的首选大小。当数据位于这种边界上时,访问内存比跨越该大小边界的访问效率更高。
例如。考虑简单的结构:
struct myStruct
{
int a;
char b;
int c;
} data;
如果机器是32位机器,并且数据在32位边界上对齐,则我们会看到一个紧迫的问题(假设没有结构对齐)。在此示例中,让我们假设结构数据从地址1024开始(0x400-请注意,最低的2位为零,因此数据与32位边界对齐)。对data.a的访问将正常进行,因为它始于边界-0x400。对data.b的访问也可以正常工作,因为它位于地址0x404(另一个32位边界)上。但是,未对齐的结构会将data.c放在地址0x405。data.c的4个字节位于0x405、0x406、0x407、0x408。在32位计算机上,系统将在一个内存周期内读取data.c,但只会获取4个字节中的3个(第4个字节位于下一个边界)。因此,系统将必须进行第二次内存访问才能获得第4个字节,
现在,如果编译器不是将data.c放在地址0x405上,而是将结构填充3个字节并将data.c放在地址0x408上,那么系统将只需要1个周期来读取数据,从而减少了对该数据元素的访问时间减少了50%填充将内存效率交换为处理效率。鉴于计算机可以拥有大量的内存(许多GB),因此编译器认为交换(速度超过大小)是一个合理的选择。
不幸的是,当您尝试通过网络发送结构甚至将二进制数据写入二进制文件时,此问题将成为致命的杀手。在结构或类的元素之间插入的填充可能会破坏发送到文件或网络的数据。为了编写可移植的代码(一个将用于多个不同的编译器的代码),您可能必须分别访问结构的每个元素,以确保正确的“打包”。
另一方面,不同的编译器具有管理数据结构打包的不同能力。例如,在Visual C / C ++中,编译器支持#pragma pack命令。这将允许您调整数据打包和对齐。
例如:
#pragma pack 1
struct MyStruct
{
int a;
char b;
int c;
short d;
} myData;
I = sizeof(myData);
我现在的长度应该为11。如果没有编译指示,则我可以是11到14之间的任何值(对于某些系统,它最多可以是32个),具体取决于编译器的默认打包方式。
#pragma pack
。如果按默认对齐方式分配成员,我通常会说该结构未打包。
C99 N1256标准草案
http://www.open-std.org/JTC1/SC22/WG14/www/docs/n1256.pdf
6.5.3.4 sizeof运算符:
3当应用于具有结构或联合类型的操作数时,结果是此类对象中的字节总数,包括内部填充和结尾填充。
6.7.2.1结构和联合说明符:
13 ...结构对象内可能有未命名的填充,但在其开始处没有。
和:
15在结构或联合的末尾可能存在未命名的填充。
新的C99 灵活数组成员功能(struct S {int is[];};
)也可能影响填充:
16作为特殊情况,结构中具有多个命名成员的最后一个元素可能具有不完整的数组类型;这称为灵活数组成员。在大多数情况下,柔性数组成员将被忽略。特别地,该结构的尺寸就好像省略了柔性阵列构件,除了其可能具有比省略所暗示的更多的尾随填充。
附件J可移植性问题重申:
未指定以下内容:...
- 在结构或联合中存储值时填充字节的值(6.2.6.1)
C ++ 11 N3337标准草案
http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2012/n3337.pdf
5.3.3 Sizeof:
2当应用于一个类时,结果是该类对象中的字节数,包括将该类型的对象放置在数组中所需的任何填充。
9.2班级成员:
指向标准布局结构对象的指针(使用reinterpret_cast进行了适当的转换)指向其初始成员(或者,如果该成员是位字段,则指向其驻留的单元),反之亦然。[注意:因此,在标准布局结构对象中可能会存在未命名的填充,但在其开始时可能没有,这是实现适当对齐所必需的。—尾注]
我只知道足够的C ++可以理解注释:-)
C语言为编译器提供了一些有关内存中结构元素位置的自由度:
C语言为程序员提供了结构中元素布局的一些保证:
与元素对齐有关的问题:
对齐方式如何工作:
ps此处有更多详细信息:“ Samuel P.Harbison,Guy L.Steele CA参考,(5.6.2-5.6.7)”
这个想法是出于速度和缓存方面的考虑,应该从与它们的自然大小对齐的地址中读取操作数。为了实现这一点,编译器填充了结构成员,以便对齐后面的成员或后面的结构。
struct pixel {
unsigned char red; // 0
unsigned char green; // 1
unsigned int alpha; // 4 (gotta skip to an aligned offset)
unsigned char blue; // 8 (then skip 9 10 11)
};
// next offset: 12
x86体系结构始终能够获取未对齐的地址。但是,它速度较慢,并且当未对齐重叠两条不同的缓存行时,如果对齐的访问仅逐出一条,则它将逐出两条缓存行。
实际上,有些架构必须捕获未对齐的读写,以及ARM架构的早期版本(已演化为当今所有移动CPU的一种)……好吧,实际上它们只是为这些架构返回了错误的数据。(他们忽略了低位。)
最后,请注意,缓存行可以任意大,并且编译器不会尝试猜测这些行或进行空间与速度的权衡。取而代之的是,对齐决策是ABI的一部分,代表最终将均匀填充缓存行的最小对齐。
TL; DR:对齐很重要。