什么是聚合和POD,它们为何/为什么特别?


548

常见问题是关于聚合和POD的,涵盖以下材料:

  • 什么是骨料
  • 什么是POD(普通旧数据)?
  • 它们有什么关系?
  • 它们如何以及为什么如此特别?
  • C ++ 11有什么变化?


可以说这些定义背后的动机大致是:POD ==可存储,聚合==聚合可初始化?
Ofek Shilon

Answers:


571

如何阅读:

本文相当长。如果您想了解聚合和POD(普通旧数据),请花些时间阅读。如果您仅对聚合感兴趣,则仅阅读第一部分。如果你只在荚感兴趣,那么你必须首先阅读的定义,内涵和聚集的例子,那么你就可以跳转到荚,但我还是希望推荐阅读全部的第一部分。聚合的概念对于定义POD至关重要。如果您发现任何错误(即使是次要错误,包括语法,文体,格式,语法等),请留下评论,我会进行编辑。

此答案适用于C ++ 03。有关其他C ++标准,请参见:

什么是集合体以及为什么它们很特殊

来自C ++标准(C ++ 03 8.5.1§1)的形式定义

集合是没有用户声明的构造函数(12.1),没有私有或受保护的非静态数据成员(第11章),没有基类(第10章)以及没有虚函数(10.3)的数组或类(第9节) )。

好了,让我们解析一下这个定义。首先,任何数组都是聚合。如果……等一下,一个类也可以是一个集合。没有关于结构或联合的任何说法,难道它们不是集合体吗?是的他们可以。在C ++中,该术语class是指所有类,结构和联合。因此,当且仅当一个类(或结构或联合)满足上述定义的条件时,该类才是集合。这些标准意味着什么?

  • 这并不意味着聚合类不能具有构造函数,实际上,它可以具有默认构造函数和/或副本构造函数,只要它们是由编译器隐式声明的,而不是由用户显式声明的

  • 没有私有或受保护的非静态数据成员。您可以根据需要拥有任意数量的私有和受保护的成员函数(但不能具有构造函数)以及私有或受保护的静态数据成员和成员函数,并且不违反聚合类的规则

  • 聚合类可以具有用户声明/用户定义的副本分配运算符和/或析构函数

  • 数组是聚合的,即使它是非聚合类类型的数组也是如此。

现在让我们看一些例子:

class NotAggregate1
{
  virtual void f() {} //remember? no virtual functions
};

class NotAggregate2
{
  int x; //x is private by default and non-static 
};

class NotAggregate3
{
public:
  NotAggregate3(int) {} //oops, user-defined constructor
};

class Aggregate1
{
public:
  NotAggregate1 member1;   //ok, public member
  Aggregate1& operator=(Aggregate1 const & rhs) {/* */} //ok, copy-assignment  
private:
  void f() {} // ok, just a private function
};

你明白了。现在,让我们看看聚合的特殊之处。与非聚合类不同,它们可以使用花括号初始化{}。这种初始化语法是数组众所周知的,我们刚刚了解到它们是集合。因此,让我们从它们开始。

Type array_name[n] = {a1, a2, …, am};

如果(M == n)的
第i阵列的元件与初始化
否则如果(M <N)
的数组的第m个元素与一个初始化 1,一个 2,...,A,而另一n - m元件是,如果可能的话,值初始化(见下文的术语的解释)
否则如果(M> N)
,编译器将发出错误
否则 (是这种情况,当n在所有像未指定int a[] = {1, 2, 3};
的大小假设数组(n)等于m,所以int a[] = {1, 2, 3};等价于int a[3] = {1, 2, 3};

当标量类型(的目的boolintchardouble,指针等)是值初始化这意味着它是与初始化0为该类型(false对于bool0.0对于double,等等)。使用用户声明的默认构造函数对类类型的对象进行值初始化时,将调用其默认构造函数。如果隐式定义了默认构造函数,则所有非静态成员都将递归地进行值初始化。这个定义是不精确的,有点不正确,但它应该为您提供基本概念。引用不能进行值初始化。非聚合类的值初始化可能会失败,例如,如果该类没有适当的默认构造函数。

数组初始化的示例:

class A
{
public:
  A(int) {} //no default constructor
};
class B
{
public:
  B() {} //default constructor available
};
int main()
{
  A a1[3] = {A(2), A(1), A(14)}; //OK n == m
  A a2[3] = {A(2)}; //ERROR A has no default constructor. Unable to value-initialize a2[1] and a2[2]
  B b1[3] = {B()}; //OK b1[1] and b1[2] are value initialized, in this case with the default-ctor
  int Array1[1000] = {0}; //All elements are initialized with 0;
  int Array2[1000] = {1}; //Attention: only the first element is 1, the rest are 0;
  bool Array3[1000] = {}; //the braces can be empty too. All elements initialized with false
  int Array4[1000]; //no initializer. This is different from an empty {} initializer in that
  //the elements in this case are not value-initialized, but have indeterminate values 
  //(unless, of course, Array4 is a global array)
  int array[2] = {1, 2, 3, 4}; //ERROR, too many initializers
}

现在,让我们看看如何使用花括号初始化聚合类。几乎相同的方式。代替数组元素,我们将按照它们在类定义中出现的顺序初始化非静态数据成员(根据定义它们都是公共的)。如果初始化程序少于成员,则其余的将被值初始化。如果不可能对未显式初始化的成员之一进行值初始化,则会出现编译时错误。如果初始化程序超出了必要,我们也会得到一个编译时错误。

struct X
{
  int i1;
  int i2;
};
struct Y
{
  char c;
  X x;
  int i[2];
  float f; 
protected:
  static double d;
private:
  void g(){}      
}; 

Y y = {'a', {10, 20}, {20, 30}};

在上述示例中y.c被初始化'a'y.x.i110y.x.i220y.i[0]20y.i[1]30y.f为值初始化,即,与初始化0.0。受保护的静态成员d根本没有初始化,因为它是static

聚合联合的不同之处在于,您可以仅使用大括号初始化其第一个成员。我认为,如果您在C ++方面具有足够的先进水平,甚至可以考虑使用并集(它们的使用可能非常危险,必须仔细考虑),则可以自己在标准中查找并集的规则:)。

现在我们知道聚合的特殊之处,让我们尝试了解对类的限制。那就是为什么他们在那里。我们应该理解,使用大括号的成员方式初始化意味着该类不过是其成员的总和。如果存在用户定义的构造函数,则意味着用户需要做一些额外的工作来初始化成员,因此括号初始化将是不正确的。如果存在虚函数,则意味着该类的对象(在大多数实现中)具有指向该类的所谓vtable的指针,该指针在构造函数中设置,因此括号初始化将不足。您可以通过练习类似的方式找出其余限制:)。

关于聚集体已经足够了。现在我们可以定义一组更严格的类型,例如POD

什么是POD及其特殊性

C ++标准的正式定义(C ++ 03 9§4

POD结构是一个聚合类,它没有类型为非POD结构,非POD联合(或此类数组)或引用的非静态数据成员,并且没有用户定义的副本分配运算符,并且没有用户定义的析构函数。同样,POD联合是一个聚合联合,它不具有非POD结构,非POD联合(或此类数组)或引用类型的非静态数据成员,并且不具有用户定义的副本分配运算符且没有用户定义的析构函数。POD类是POD结构或POD联合的类。

哇,这很难解析,不是吗?:)让我们省去工会(与上述理由相同),并以更清晰的方式重新措辞:

如果聚合类没有用户定义的复制分配运算符和析构函数,并且其非静态成员都不是非POD类,非POD数组或引用,则称为POD。

这个定义意味着什么?(我是否提到POD代表普通旧数据?)

  • 所有POD类都是聚合,或者换句话说,如果一个类不是聚合,则可以确定不是POD
  • 与结构一样,类都可以是POD,即使两种情况的标准术语都是POD-struct
  • 就像聚合一样,该类具有哪些静态成员也没关系

例子:

struct POD
{
  int x;
  char y;
  void f() {} //no harm if there's a function
  static std::vector<char> v; //static members do not matter
};

struct AggregateButNotPOD1
{
  int x;
  ~AggregateButNotPOD1() {} //user-defined destructor
};

struct AggregateButNotPOD2
{
  AggregateButNotPOD1 arrOfNonPod[3]; //array of non-POD class
};

POD类,POD联合,标量类型以及此类类型的数组统称为POD类型。
POD在许多方面都很特殊。我将仅提供一些示例。

  • POD类最接近C结构。与它们不同,POD可以具有成员函数和任意静态成员,但是这两个都不能更改对象的内存布局。因此,如果您想编写一个或多或少可移植的动态库,可以在C甚至.NET中使用,则应尝试使所有导出的函数采用并仅返回POD类型的参数。

  • 非POD类类型的对象的生存期在构造函数完成时开始,而在析构函数完成时结束。对于POD类,生存期从该对象的存储被占用开始,到该存储被释放或重新使用时结束。

  • 对于POD类型的对象,该标准保证,当您memcpy将对象的内容放入char或unsigned char数组中,然后memcpy将内容返回到您的对象中时,该对象将保留其原始值。请注意,对于非POD类型的对象没有这样的保证。另外,您可以使用来安全地复制POD对象memcpy。下面的示例假定T为POD类型:

    #define N sizeof(T)
    char buf[N];
    T obj; // obj initialized to its original value
    memcpy(buf, &obj, N); // between these two calls to memcpy,
    // obj might be modified
    memcpy(&obj, buf, N); // at this point, each subobject of obj of scalar type
    // holds its original value
  • goto语句。如您所知,通过goto从尚未在范围内的某个变量跳转到已经在范围内的某个点是非法的(编译器应发出错误)。仅当变量为非POD类型时,此限制才适用。在以下示例中,格式错误,f()g()格式正确。请注意,Microsoft的编译器在使用此规则时过于宽松-在两种情况下都只会发出警告。

    int f()
    {
      struct NonPOD {NonPOD() {}};
      goto label;
      NonPOD x;
    label:
      return 0;
    }
    
    int g()
    {
      struct POD {int i; char c;};
      goto label;
      POD x;
    label:
      return 0;
    }
  • 确保在POD对象的开头没有填充。换句话说,如果POD类A的第一个成员是T类型,则可以安全地reinterpret_castA*获取T*并获得指向第一个成员的指针,反之亦然。

清单还在不断……

结论

重要的是要了解POD到底是什么,因为如您所见,许多语言功能对其行为有所不同。


3
好答案。注释:“如果隐式定义了默认构造函数,则将对所有非静态成员进行递归值初始化。” 和“非聚合类的值初始化可能会失败,例如,如果该类没有适当的默认构造函数。” 是不正确的:使用隐式声明的默认构造函数初始化类的值并不一定需要隐式定义的默认构造函数。因此,给定(private:酌情插入):struct A { int const a; };然后A()格式正确,即使A默认的构造函数定义格式不正确也是如此。
Johannes Schaub-litb

4
@Kev:如果您设法将相同的信息打包成一个简短的答案,我们都会很乐意对其进行投票!
2010年

3
@Armen还会注意您可以对同一问题进行多个回答。每个答案都可以包含问题解决方案的一部分。在我看来,拧紧那些已被接受的标记的东西:)
约翰内斯·绍布

3
答案很好。我仍然有一段时间重新浏览这篇文章。顺便说一下有关Visual Studio的警告。如前所述,pod的“ goto语句”对MSVC编译器不了解。但是对于switch / case语句,它将生成编译错误。:在此基础上概念,我已经取得了一些测试-POD-检查stackoverflow.com/questions/12232766/test-for-pod-ness-in-c-c11/...
bruziuz

2
以“非POD类类型的对象的生存期在构造函数完成时开始,在析构函数完成时结束”开头的要点中。最后一部分应该改为“当析构函数启动时”。
Quokka

457

C ++ 11有什么变化?

骨料

聚合的标准定义略有变化,但仍然几乎相同:

集合是一个数组或一个类(第9条),没有用户提供的构造函数(12.1),没有针对非静态数据成员的大括号或相等初始化器(9.2),没有私有或受保护的非静态数据成员(第11条),无基类(第10条)和虚拟函数(10.3)。

好吧,什么改变了?

  1. 以前,聚合可以没有用户声明的构造函数,但是现在它不能具有用户提供的构造函数。有区别吗?是的,有,因为现在您可以声明构造函数并默认使用它们:

    struct Aggregate {
        Aggregate() = default; // asks the compiler to generate the default implementation
    };

    这仍然是一个汇总,因为在第一个声明中默认使用的构造函数(或任何特殊的成员函数)不是用户提供的。

  2. 现在,聚合不能为非静态数据成员提供任何括号或相等的初始化程序。这是什么意思?好吧,这仅仅是因为有了这个新标准,我们可以像这样直接在类中初始化成员:

    struct NotAggregate {
        int x = 5; // valid in C++11
        std::vector<int> s{1,2,3}; // also valid
    };

    使用此功能使该类不再聚合,因为它基本上等效于提供您自己的默认构造函数。

因此,什么是合计根本没有多大变化。仍然是相同的基本思想,适用于新功能。

POD呢?

POD经历了很多变化。在此新标准中放宽了许多以前关于POD的规则,并且对该标准中提供定义的方式进行了根本性的更改。

POD的概念基本上是捕获两个不同的属性:

  1. 它支持静态初始化,并且
  2. 用C ++编译POD可以为您提供与用C编译的结构相同的内存布局。

因此,该定义已分为两个不同的概念:琐碎类和标准布局类,因为它们比POD更有用。现在,该标准很少使用术语POD,而是更具体的琐碎标准布局概念。

新定义基本上说POD是一个既琐碎又具有标准布局的类,并且此属性必须对所有非静态数据成员进行递归保存:

POD结构是既属于普通类又属于标准布局类的非联盟类,并且不具有非POD结构,非POD联合(或此类数组)类型的非静态数据成员。类似地,POD联合是既是琐碎的类又是标准布局类的联合,并且不具有非POD结构,非POD联合(或此类数组)类型的非静态数据成员。POD类是可以是POD结构或POD联合的类。

让我们分别详细研究这两个属性。

普通班

琐碎是上面提到的第一个属性:琐碎类支持静态初始化。如果一个类是普通可复制的(普通类的超集),则可以使用诸如此类的东西复制其表示形式,memcpy并期望结果是相同的。

该标准定义了一个简单的类,如下所示:

普通可复制的类是这样的类:

—没有非平凡的副本构造函数(12.8),

-没有简单的move构造函数(12.8),

—没有非平凡的副本分配运算符(13.5.3、12.8),

—没有非平凡的移动分配运算符(13.5.3、12.8),并且

—具有琐碎的析构函数(12.4)。

普通类是具有普通默认构造函数(12.1)且可复制的类。

[ 注意:特别是,平凡可复制或平凡的类没有虚拟函数或虚拟基类。—尾注 ]

那么,那些琐碎和非琐碎的事情到底是什么呢?

如果类X的复制/移动构造函数不是由用户提供的,并且不是

—类X没有虚拟函数(10.3)和虚拟基类(10.1),并且

—选择复制/移动每个直接基类子对象的构造函数很简单,并且

—对于类类型(或其数组)的X的每个非静态数据成员,选择用来复制/移动该成员的构造函数都是微不足道的;

否则,复制/移动构造函数是不平凡的。

基本上,这意味着如果复制或移动构造函数不是由用户提供的,则它是微不足道的,该类中没有虚拟的,并且此属性递归地包含在该类的所有成员和基类中。

普通复制/移动赋值运算符的定义非常相似,只是将“构造函数”一词替换为“赋值运算符”。

琐碎的析构函数也具有类似的定义,但增加了限制,即它不能是虚拟的。

对于琐碎的默认构造函数还有另一条类似的规则,另外,如果该类具有带有brace-or-equal-initializers的非静态数据成员,则默认构造函数并非无关紧要的,如上所示。

以下是一些示例,可以清除所有问题:

// empty classes are trivial
struct Trivial1 {};

// all special members are implicit
struct Trivial2 {
    int x;
};

struct Trivial3 : Trivial2 { // base class is trivial
    Trivial3() = default; // not a user-provided ctor
    int y;
};

struct Trivial4 {
public:
    int a;
private: // no restrictions on access modifiers
    int b;
};

struct Trivial5 {
    Trivial1 a;
    Trivial2 b;
    Trivial3 c;
    Trivial4 d;
};

struct Trivial6 {
    Trivial2 a[23];
};

struct Trivial7 {
    Trivial6 c;
    void f(); // it's okay to have non-virtual functions
};

struct Trivial8 {
     int x;
     static NonTrivial1 y; // no restrictions on static members
};

struct Trivial9 {
     Trivial9() = default; // not user-provided
      // a regular constructor is okay because we still have default ctor
     Trivial9(int x) : x(x) {};
     int x;
};

struct NonTrivial1 : Trivial3 {
    virtual void f(); // virtual members make non-trivial ctors
};

struct NonTrivial2 {
    NonTrivial2() : z(42) {} // user-provided ctor
    int z;
};

struct NonTrivial3 {
    NonTrivial3(); // user-provided ctor
    int w;
};
NonTrivial3::NonTrivial3() = default; // defaulted but not on first declaration
                                      // still counts as user-provided
struct NonTrivial5 {
    virtual ~NonTrivial5(); // virtual destructors are not trivial
};

标准版式

标准布局是第二个属性。该标准提到它们对于与其他语言进行通信很有用,这是因为标准布局类具有与等效C结构或联合相同的内存布局。

这是另一个必须递归保存成员和所有基类的属性。而且像往常一样,不允许使用虚拟函数或虚拟基类。这将使布局与C不兼容。

这里的一个宽松规则是,标准布局类必须使所有非静态数据成员具有相同的访问控制。以前这些必须是所有公众,但现在你可以让他们的私人或受保护的,只要它们是所有私人或全部保护。

使用继承时,整个继承树中只有一个类可以具有非静态数据成员,并且第一个非静态数据成员不能为基类类型(这可能会破坏别名规则),否则,它不是标准的-布局类。

这是标准文本中的定义:

标准布局类是这样的类:

—没有非标准布局类(或此类数组)或引用的非静态数据成员,

—没有虚拟函数(10.3)和虚拟基类(10.1),

—对所有非静态数据成员具有相同的访问控制(条款11),

-没有非标准布局的基类,

—在最派生的类中没有非静态数据成员,在一个非静态数据成员中最多没有一个基类,或者没有非静态数据成员的基类,并且

—没有与第一个非静态数据成员相同类型的基类。

标准布局结构是使用class-key结构或class-key类定义的标准布局类。

标准布局联合是使用class-key联合定义的标准布局类。

[ 注意:标准布局类对于与其他编程语言编写的代码进行通信很有用。其布局在9.2中指定。—尾注 ]

让我们看几个例子。

// empty classes have standard-layout
struct StandardLayout1 {};

struct StandardLayout2 {
    int x;
};

struct StandardLayout3 {
private: // both are private, so it's ok
    int x;
    int y;
};

struct StandardLayout4 : StandardLayout1 {
    int x;
    int y;

    void f(); // perfectly fine to have non-virtual functions
};

struct StandardLayout5 : StandardLayout1 {
    int x;
    StandardLayout1 y; // can have members of base type if they're not the first
};

struct StandardLayout6 : StandardLayout1, StandardLayout5 {
    // can use multiple inheritance as long only
    // one class in the hierarchy has non-static data members
};

struct StandardLayout7 {
    int x;
    int y;
    StandardLayout7(int x, int y) : x(x), y(y) {} // user-provided ctors are ok
};

struct StandardLayout8 {
public:
    StandardLayout8(int x) : x(x) {} // user-provided ctors are ok
// ok to have non-static data members and other members with different access
private:
    int x;
};

struct StandardLayout9 {
    int x;
    static NonStandardLayout1 y; // no restrictions on static members
};

struct NonStandardLayout1 {
    virtual f(); // cannot have virtual functions
};

struct NonStandardLayout2 {
    NonStandardLayout1 X; // has non-standard-layout member
};

struct NonStandardLayout3 : StandardLayout1 {
    StandardLayout1 x; // first member cannot be of the same type as base
};

struct NonStandardLayout4 : StandardLayout3 {
    int z; // more than one class has non-static data members
};

struct NonStandardLayout5 : NonStandardLayout3 {}; // has a non-standard-layout base class

结论

有了这些新规则,现在可以将更多类型的POD用作POD。即使类型不是POD,我们也可以单独利用某些POD属性(如果它只是普通布局或标准布局之一)。

标准库具有在标题中测试这些属性的特征<type_traits>

template <typename T>
struct std::is_pod;
template <typename T>
struct std::is_trivial;
template <typename T>
struct std::is_trivially_copyable;
template <typename T>
struct std::is_standard_layout;

2
您能否详细说明以下规则:a)标准布局类必须使所有非静态数据成员具有相同的访问控制;b)整个继承树中只有一个类可以具有非静态数据成员,并且第一个非静态数据成员不能属于基类类型(这可能会破坏别名规则)。特别是它们的原因是什么?对于后面的规则,您能否提供一个打破混叠的示例?
安德烈·蒂利奇科

@AndyT:看我的答案。我尽我所能回答。
Nicol Bolas 2012年

5
可能要针对C ++ 14进行更新,该版本删除了聚合的“无括号或相等的初始化程序”要求。
TC

@TC感谢单挑。我将尽快查找这些更改并进行更新。
R. Martinho Fernandes 2014年

1
关于别名:有一个C ++布局规则,如果类C具有一个(空的)基X,并且C的第一个数据成员是类型X,则该第一个成员不能与基X处于相同的偏移量;如果需要避免它,它将在其前面获得一个伪填充字节。在相同的地址处有两个X(或子类)实例可能会破坏需要通过其地址来区分不同实例的事物(一个空实例没有其他可区分的对象……)。在任何情况下,放入该填充字节的需求都会破坏“布局兼容”。
greggo

106

C ++ 14发生了什么变化

我们可以参考C ++ 14草案标准以供参考。

骨料

8.5.1 聚合部分对此进行了介绍,该分类为我们提供了以下定义:

聚合是没有用户提供的构造函数(12.1),没有私有或受保护的非静态数据成员(第11章),没有基类(第10章)和没有虚函数(10.3)的数组或类(第9章)。 )。

现在唯一的变化是添加类内成员初始化器不会使类成为非聚合类。因此,以下C ++ 11中的示例汇总了成员in-pace初始化器的类的初始化

struct A
{
  int a = 3;
  int b = 3;
};

在C ++ 11中不是聚合,但在C ++ 14中。N3605:成员初始化器和聚合涵盖了此更改,其摘要如下:

Bjarne Stroustrup和Richard Smith提出了一个关于聚合初始化和成员初始化器无法协同工作的问题。本文建议采用Smith提出的措辞来解决此问题,该措辞消除了聚合不能具有成员初始化程序的限制。

POD保持不变

类”部分介绍了POD(纯旧数据)结构的定义。9 其中说:

POD结构110是既是琐碎的类又是标准布局类的非联盟类,并且不具有非POD结构,非POD联合(或此类数组)类型的非静态数据成员。类似地,POD联合是既是普通类又是标准布局类的联合,并且不具有非POD结构,非POD联合(或此类数组)类型的非静态数据成员。POD类是可以是POD结构或POD联合的类。

与C ++ 11的措辞相同。

C ++ 14的标准布局更改

如评论中所述,pod依赖于标准布局的定义,并且确实对C ++ 14有所更改,但这是通过在事后应用于C ++ 14的缺陷报告来实现的。

有三个DR:

因此,标准版式来自此Pre C ++ 14:

标准布局类是这样的类:

  • (7.1)没有非标准布局类(或此类数组)或引用的非静态数据成员,
  • (7.2)没有虚函数([class.virtual])和虚基类([class.mi]),
  • (7.3)对所有非静态数据成员具有相同的访问控制(子句[class.access]),
  • (7.4)没有非标准布局的基类,
  • (7.5)在最派生的类中没有非静态数据成员,并且最多一个具有非静态数据成员的基类,或者在非基类中没有非静态数据成员,并且
  • (7.6)没有与第一个非静态数据成员相同类型的基类。109

为此在C ++ 14中

如果满足以下条件,则S类为标准布局类:

  • (3.1)没有非标准布局类(或此类数组)或引用的非静态数据成员,
  • (3.2)没有虚函数,也没有虚基类,
  • (3.3)对所有非静态数据成员具有相同的访问控制,
  • (3.4)没有非标准布局的基类,
  • (3.5)最多具有任何给定类型的一个基类子对象,
  • (3.6)具有该类及其基类中的所有非静态数据成员和位字段,它们首先在同一类中声明,并且
  • (3.7)没有类型集合M(S)的元素作为基类,其中对于任何类型X,M(X)的定义如下。104[注意:M(X)是以下类型的集合:所有可能在X中偏移为零的非基类子对象。
    • (3.7.1)如果X是不包含(可能是继承的)非静态数据成员的非联合类类型,则集合M(X)为空。
    • (3.7.2)如果X是具有0大小的X0类型的非静态数据成员或X的第一个非静态数据成员的X的非联盟类类型(其中所述成员可以是匿名联合) ),则集合M(X)由X0和M(X0)的元素组成。
    • (3.7.3)如果X是联合类型,则集合M(X)是所有M(Ui)和包含所有Ui的集合的联合,其中每个Ui是X的第i个非静态数据成员的类型。
    • (3.7.4)如果X是元素类型为Xe的数组类型,则集合M(X)由Xe和M(Xe)的元素组成。
    • (3.7.5)如果X是非类,非数组类型,则集合M(X)为空。

4
有一个建议,允许聚合具有基类,只要它是默认可构造的即可,请参见N4404
Shafik Yaghmour

而POD可能保持不变,C ++ 14 StandardLayoutType,这对于POD的要求,根据cppref已经改变:en.cppreference.com/w/cpp/named_req/StandardLayoutType
西罗桑蒂利郝海东冠状病六四事件法轮功

1
@CiroSantilli新疆改造中心六四事件法轮功谢谢,我不知道我是怎么想念这些的,我会在接下来的几天里尝试更新。
Shafik Yaghmour '18 -10-25

让我知道您是否能提出一个在C ++ 14中是POD但在C ++ 11中不是POD的示例:-)我从以下位置开始了示例的详细列表:stackoverflow.com/questions/146452/what- are-pod-types-in-c /…
Ciro Santilli郝海东冠状病六四事件法轮功

1
@CiroSantilli新疆改造中心六四事件法轮功,所以这里发生的是,如果我们看一下它们匹配的C ++ 11C ++ 14中的标准布局描述。这些更改通过缺陷报告应用到C ++ 14。因此,当我最初写这篇文章时,它是正确的:-p
Shafik Yaghmour

47

您能否详细说明以下规则:

我会尽力:

a)标准布局类必须具有所有具有相同访问控制的非静态数据成员

这很简单:所有的非静态数据成员必须全部publicprivateprotected。你不能有public一些private

对于它们的推理转到完全在“标准布局”和“非标准布局”之间进行区分的推理。即,给予编译器自由选择如何将事物放入内存的自由。这不仅仅是关于vtable指针。

当他们在98年对C ++进行标准化时,他们必须基本预测人们将如何实现它。尽管他们在各种C ++方面都有相当多的实现经验,但是他们对事情并不确定。因此,他们决定谨慎行事:给予编译器尽可能多的自由。

这就是为什么C ++ 98中POD的定义如此严格的原因。它为大多数类的C ++编译器提供了很大的自由度。基本上,POD类型旨在作为特殊情况,这是您专门编写的原因。

在使用C ++ 11时,他们在编译器方面有很多经验。他们意识到... C ++编译器作者确实很懒。他们拥有所有这些自由,但对此却无能为力

标准布局的规则或多或少编纂了惯例,即:大多数编译器实际上根本不需要为实现它们做任何改动(除了相应类型特征的某些东西之外)。

现在,当涉及到public/时private,情况有所不同。对成员进行重新排序的自由与否publicprivate真正编译器至关重要,特别是在调试版本中。并且由于标准布局的重点是与其他语言的兼容性,所以在调试与发行版本中,您不能使布局有所不同。

然后就是事实并没有真正伤害到用户。如果您要创建一个封装的类,那么所有数据成员private仍然会存在的可能性很大。通常,您不会在完全封装的类型上公开公共数据成员。因此,对于只有少数想要这样做的用户来说,这将是一个问题。

因此,没有太大的损失。

b)整个继承树中只有一个类可以具有非静态数据成员,

之所以这样做,是因为他们再次标准化了标准布局:惯例。

没有普遍的做法,当谈到有实际存储的东西继承树的两个成员。有些人将基类放在派生类之前,而另一些人则采用其他方式。如果成员来自两个基类,您将如何订购它们?等等。编译器在这些问题上分歧很大。

同样,由于零/一/无穷大规则,一旦您说可以拥有两个带有成员的类,就可以说任意多个。这就需要添加很多布局规则以处理此问题。您必须说说多重继承的工作原理,哪些类将其数据放在其他类之前,等等。这是很多规则,实际上没有什么好处。

您不能使所有没有虚函数和默认构造函数标准布局的东西。

并且第一个非静态数据成员不能为基类类型(这可能会破坏别名规则)。

我真的不能和这个说话。我对C ++的别名规则没有足够的了解,无法真正理解它。但这与基成员将与基类本身共享相同的地址有关。那是:

struct Base {};
struct Derived : Base { Base b; };

Derived d;
static_cast<Base*>(&d) == &d.b;

这可能违反了C ++的别名规则。某种程度上来说。

但是,请考虑以下问题:具备此功能的能力实际上可能有多大用处?由于只有一个类可以具有非静态数据成员,因此Derived必须是该类(因为它具有a Base作为成员)。因此Base 必须为空(数据)。如果Base为空,以及一个基类,那么为什么要有一个数据成员呢?

由于Base为空,因此没有状态。因此,任何非静态成员函数都将根据其参数而不是其this指针执行操作。

再说一遍:没有大的损失。


感谢您的解释,它有很大帮助。尽管static_cast<Base*>(&d)和类型&d.b相同Base*,但它们可能指向不同的事物,从而打破了混叠规则。请纠正我。
Andriy Tylychko,2012年

1
而且,为什么如果只有一个类可以具有非静态数据成员,那么为什么Derived必须是该类?
Andriy Tylychko

3
@AndyT:为了使Derived的第一个成员成为其基类,它必须具有两件事:基类和member。而且,由于层次结构中只有一个类可以具有成员(并且仍然是标准布局),因此这意味着其基类不能具有成员。
Nicol Bolas '02

3
@AndyT,是的,IME,关于别名规则,您基本上是正确的。要求具有相同类型的两个不同实例具有不同的内存地址。(这允许使用内存地址跟踪对象身份。)基础对象和第一个派生成员是不同的实例,因此它们必须具有不同的地址,这迫使添加填充,从而影响类的布局。如果它们是不同类型,那就没关系了。允许不同类型的对象具有相同的地址(例如,一个类及其第一个数据成员)。
亚当·彼得森

46

C ++ 17的变化

此处下载C ++ 17国际标准最终草案。

骨料

C ++ 17扩展并增强了聚合和聚合初始化。现在,标准库还包括std::is_aggregate类型特征类。这是来自11.6.1.1和11.6.1.2节的正式定义(省略了内部引用):

集合是一个数组或一个类,
没有用户提供的,显式的或继承的构造函数,
没有私有的或受保护的非静态数据成员,
没有虚拟的函数,
没有虚拟的,私有的或受保护的基类。
[注意:聚合初始化不允许访问受保护的私有基类的成员或构造函数。—
最终注释] 聚合的元素为:
—对于数组,数组元素按下标顺序递增;或者
—对于类,按声明顺序排列直接基类,后跟不是匿名联盟的成员,按声明顺序。

发生了什么变化?

  1. 集合现在可以具有公共的非虚拟基类。此外,不要求基类是聚合。如果它们不是聚合,则将它们初始化列表。
struct B1 // not a aggregate
{
    int i1;
    B1(int a) : i1(a) { }
};
struct B2
{
    int i2;
    B2() = default;
};
struct M // not an aggregate
{
    int m;
    M(int a) : m(a) { }
};
struct C : B1, B2
{
    int j;
    M m;
    C() = default;
};
C c { { 1 }, { 2 }, 3, { 4 } };
cout
    << "is C aggregate?: " << (std::is_aggregate<C>::value ? 'Y' : 'N')
    << " i1: " << c.i1 << " i2: " << c.i2
    << " j: " << c.j << " m.m: " << c.m.m << endl;

//stdout: is C aggregate?: Y, i1=1 i2=2 j=3 m.m=4
  1. 不允许使用默认的默认构造函数
struct D // not an aggregate
{
    int i = 0;
    D() = default;
    explicit D(D const&) = default;
};
  1. 不允许继承构造函数
struct B1
{
    int i1;
    B1() : i1(0) { }
};
struct C : B1 // not an aggregate
{
    using B1::B1;
};


普通班

琐碎类的定义在C ++ 17中进行了重新设计,以解决C ++ 14中未解决的一些缺陷。这些更改本质上是技术性的。这是12.0.6的新定义(省略了内部引用):

一个普通的可复制类是一个类:
—每个副本构造函数,move构造函数,副本赋值运算符和move赋值运算符被删除或琐碎,
—至少具有一个未删除的副本构造函数,move构造函数,copy赋值运算符,或移动赋值运算符,以及
-具有一个不删除的琐碎析构函数。
普通类是可普通复制的类,并且具有一个或多个默认构造函数,所有这些构造函数都是普通的或已删除的,并且至少有一个未删除。[注意:特别是,琐碎可复制或琐碎的类没有虚函数或虚基类。

变化:

  1. 在C ++ 14下,对于一个普通的类,该类不能具有任何非普通的复制/移动构造函数/赋值运算符。但是,隐式声明为默认的构造函数/运算符可能是不平凡的,但却定义为已删除,因为例如,该类包含无法复制/移动的类类型的子对象。这种不平凡的,定义为删除的构造函数/运算符的存在将导致整个类不平凡。析构函数也存在类似的问题。C ++ 17阐明了此类构造函数/运算符的存在不会导致该类不可平凡地复制,因此也不是平凡的,而一个平凡可复制的类必须具有一个平凡的,未删除的析构函数。DR1734DR1928
  2. C ++ 14允许一个普通的可复制类(因此是一个普通的类)将每个复制/移动构造函数/赋值运算符声明为删除。如果此类也是标准布局,则可以使用进行合法的复制/移动std::memcpy。这是一个语义上的矛盾,因为通过将所有构造函数/赋值运算符定义为“删除”,该类的创建者明确希望该类不能被复制/移动,但是该类仍满足普通可复制类的定义。因此,在C ++ 17中,我们有一个新的子句,规定可平凡复制的类必须至少具有一个平凡的,不可删除的(尽管不一定可以公共访问)复制/移动构造函数/赋值运算符。参见N4148DR1734
  3. 第三个技术更改涉及默认构造函数的类似问题。在C ++ 14下,一个类可能具有琐碎的默认构造函数,这些构造函数隐式定义为Deleted,但仍然是琐碎的类。新定义阐明了一个琐碎的类必须具有至少一个琐碎,未删除的默认构造函数。参见DR1496

标准布局类

还对标准布局的定义进行了修改,以解决缺陷报告。同样,这些更改本质上是技术性的。这是来自标准(12.0.7)的文本。和以前一样,省略了内部引用:

如果满足以下条件,则类S为标准布局类:
—没有非标准布局类(或此类数组)或引用的非静态数据成员,
—没有虚函数且没有虚拟基类,
—对所有非静态数据成员具有相同的访问控制,
-没有非标准布局基类,
-最多具有任何给定类型的一个基类子对象,
-具有所有非静态数据成员和位域该类及其基类首先在同一个类中声明,并且
—没有类型集M(S)的元素(定义如下)作为基类。108M
(X)的定义如下:
如果X是不具有( (可能是继承的)非静态数据成员,则集合M(X)为空。
—如果X是其第一个非静态数据成员具有类型X0(其中该成员可以是匿名联合)的非联盟类类型,则集合M(X)由X0和M(X0)的元素组成。
-如果X是一个联合类型,所述一组M(X)是所有M(UI)和包含所有的UI,其中,每个UI是X的第i个非静态数据成员的类型的集合的并集
-如果X是元素类型为Xe的数组类型,集合M(X)由Xe和M(Xe)的元素组成。
—如果X是非类,非数组类型,则集合M(X)为空。
[注意:M(X)是在标准布局类中保证在X中的零偏移处的所有非基类子对象的类型的集合。—尾注]
[示例:

struct B { int i; }; // standard-layout class
struct C : B { }; // standard-layout class
struct D : C { }; // standard-layout class
struct E : D { char : 4; }; // not a standard-layout class
struct Q {};
struct S : Q { };
struct T : Q { };
struct U : S, T { }; // not a standard-layout class
[-结束示例]
108)这样可以确保没有将具有相同类类型并且属于相同派生最多的对象的两个子对象分配给相同的地址。

变化:

  1. 阐明了派生树中只有一个类“具有”非静态数据成员的要求是指首先声明了此类数据成员的类,而不是可以继承它们的类,并将此要求扩展到了非静态位字段。还阐明了标准布局类“最多具有任何给定类型的一个基类子对象”。参见DR1813DR1881
  2. 标准布局的定义从未允许任何基类的类型与第一个非静态数据成员的类型相同。这是为了避免偏移量为零的数据成员具有与任何基类相同的类型的情况。C ++ 17标准提供了更严格的递归定义,“禁止在标准布局类中保证所有零基础类的子对象的类型的偏移量为零”,以禁止此类类型成为任何基类的类型。参见DR1672DR2120

注意:尽管新语言不在已发布的C ++ 14标准中,但C ++标准委员会希望基于缺陷报告的上述更改适用于C ++ 14。它符合C ++ 17标准。


注意我刚刚更新了我的答案,标准布局更改缺陷具有CD4状态,这意味着它们实际上已应用于C ++ 14。这就是为什么我的答案没有包括他们的原因,这是我写完答案之后发生的原因。
Shafik Yaghmour

注意,我开始悬赏这个问题。
Shafik Yaghmour

谢谢@ShafikYaghmour。我将检查缺陷报告的状态并相应地修改答案。
ThomasMcLeod

@ShafikYaghmour,在对C ++ 14流程进行了一些回顾之后,在我看来,虽然这些DR在2014年6月的Rapperswil会议上被“接受”,但从2014年2月Issaquah会议开始使用的语言就是C ++ 14。请参见isocpp.org/blog/2014/07/trip-report-summer-iso-c-meeting, “根据ISO规则,我们未正式批准对C ++工作文件的任何编辑。” 我想念什么吗?
ThomasMcLeod

它们具有“ CD4”状态,这意味着它们应在C ++ 14模式下应用。
Shafik Yaghmour

14

发生了什么变化

遵循该问题的其余明确主题之后,聚集标准的含义和使用随每个标准而不断变化。即将到来的关键变化有几个。

用户声明的构造函数P1008的类型

在C ++ 17中,此类型仍然是聚合的:

struct X {
    X() = delete;
};

因此,X{}仍然可以编译,因为那是聚合初始化-而不是构造函数调用。另请参阅:什么时候私有构造函数不是私有构造函数?

在C ++ 20中,限制将从以下要求更改:

没有用户提供的explicit,或继承的构造函数

没有用户声明或继承的构造函数

这已被C ++ 20工作草案所采用X这里和C链接中的问题都不是C ++ 20中的集合。

下面的示例也可以产生溜溜球效果:

class A { protected: A() { }; };
struct B : A { B() = default; };
auto x = B{};

在C ++ 11/14中,由于基类的缘故,B不是一个聚合,因此B{}执行值初始化,B::B()该值初始化A::A()在可访问点调用调用的对象。这是格式正确的。

在C ++ 17中,B由于允许基类而成为聚合,从而进行了B{}聚合初始化。这要求将Afrom的副本列表初始化{},但要从B无法访问的上下文外部进行初始化。在C ++ 17中,这是格式错误的(auto x = B();尽管会很好)。

现在在C ++ 20中,由于上述规则的更改,B再次不再是聚合(不是因为基类,而是因为用户声明的默认构造函数-即使它是默认的)。现在,我们回到通过B的构造函数,此代码段的格式变得正确。

从带括号的值列表P960初始化聚合

出现的一个常见问题是希望将emplace()-style构造函数与聚合一起使用:

struct X { int a, b; };
std::vector<X> xs;
xs.emplace_back(1, 2); // error

这是行不通的,因为emplace它将尝试有效地执行初始化X(1, 2),这是无效的。典型的解决方案是在上添加一个构造函数X,但是有了这个建议(当前正在通过Core进行工作),聚合将有效地合成综合的构造函数,这些构造函数做正确的事情-并且行为类似于常规构造函数。上面的代码将按原样在C ++ 20中编译。

聚合P1021(特别是P1816)的类模板参数推导(CTAD

在C ++ 17中,这不会编译:

template <typename T>
struct Point {
    T x, y;
};

Point p{1, 2}; // error

用户必须为所有聚合模板编写自己的推导指南:

template <typename T> Point(T, T) -> Point<T>;

但是由于从某种意义上讲这是“显而易见的事情”,并且基本上只是样板,因此语言将为您完成此任务。该示例将在C ++ 20中编译(不需要用户提供的推导指南)。


尽管我会投票赞成,但添加它确实有点为时过早,但是我不知道有什么重大改变会在C ++ 2x完成之前改变这一点。
沙菲克·雅格慕18/12/17 '16

@ShafikYaghmour是的,可能还为时过早。但是考虑到SD是新语言功能的最后期限,这是我所知道的仅有的两个正在进行中的操作-最坏的情况是我稍后将这些部分之一删除了吗?我只是看到悬而未决的问题而感到兴奋,并认为这是在我忘记之前进行讨论的好时机。
巴里

我了解,对于类似的案例,我曾被诱惑过几次。我总是担心一些重大的事情会改变,而我最终不得不重写它。
Shafik Yaghmour

@ShafikYaghmour似乎这里什么都不会改变:)
巴里

我希望它现在得到更新,已经发布了C ++ 20
Noone AtAll
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.