是否应该始终完全封装内部数据结构？

11

请考虑此类：

class ClassA{

    private Thing[] things; // stores data

    // stuff omitted

    public Thing[] getThings(){
        return things;
    }

}

此类将用于存储数据的数组公开给任何感兴趣的客户端代码。

我是在正在开发的应用中完成此操作的。我有一个ChordProgression存储序列Chords的类（并执行其他一些操作）。它有一个Chord[] getChords()返回和弦数组的方法。当必须更改数据结构（从数组更改为ArrayList）时，所有客户端代码都将中断。

这让我思考-也许以下方法更好：

class ClassA{

    private Thing[] things; // stores data

    // stuff omitted

    public Thing[] getThing(int index){
        return things[index];
    }

    public int getDataSize(){
        return things.length;
    }

    public void setThing(int index, Thing thing){
        things[index] = thing;
    }

}

现在，不再公开数据结构本身，而是使用委托给数据结构的公共方法，由数据结构提供的所有操作直接由包含它的类提供。

当数据结构更改时，仅这些方法就必须更改-但更改后，所有客户端代码仍然有效。

请注意，比数组更复杂的集合可能需要封闭的类来实现甚至三个以上的方法来访问内部数据结构。

这种方法常见吗？你觉得这怎么样？它还有什么缺点？让封闭的类至少实现三个公共方法以委托给内部数据结构是否合理？

design object-oriented encapsulation

— 阿维夫·科恩（Aviv Cohn）
source

14

像这样的代码：

   public Thing[] getThings(){
        return things;
    }

没什么意义，因为您的访问方法除了直接返回内部数据结构外什么也不做。您不妨声明Thing[] things为public。访问方法背后的想法是创建一个接口，以使客户端与内部更改隔离，并使客户端无法操作实际的数据结构，除非采用接口允许的谨慎方式。如您所见，当所有客户端代码都损坏时，您的访问方法并没有做到这一点-只是浪费了代码。我认为许多程序员倾向于这样编写代码，因为他们了解到某个地方所有内容都必须使用访问方法进行封装-但这就是我解释的原因。当访问方法没有任何作用时，只是为了“遵循表单”而已。

我绝对会推荐您提出的解决方案，该解决方案可以实现封装的一些最重要的目标：为客户提供健壮，谨慎的接口，以使它们与类的内部实现细节隔离开来，并且不允许他们接触内部数据结构以您认为合适的方式期望-“最低必要特权法”。如果您看看流行的大型OOP框架（例如CLR，STL，VCL），正是由于这个原因，您提出的模式已经很广泛了。

你应该一直这样做吗？不必要。例如，如果您有帮助者或朋友类，它们实际上是您的主要工作者类的组成部分，并且不是“正面”的，则没有必要-这是一个过大的选择，它将添加许多不必要的代码。在那种情况下，我根本不会使用访问方法-如所解释的那样，这是毫无意义的。只需以仅适用于使用它的主类的方式声明数据结构-大多数语言都支持这样做的方法- friend或在与主worker类相同的文件中声明它，等等。

我可以在您的建议中看到的唯一缺点是，编码需要更多的工作（现在您将不得不重新编码消费者类-但您仍然必须这样做。）但这并不是真正的缺点。 -您需要做正确的事，有时这需要更多的工作。

使一个好的程序员变得更好的一件事是，他们知道什么时候额外的工作值得，什么时候不值得。从长远来看，现在投入额外的资金将在将来获得丰厚的回报-如果不在该项目上，那么在其他项目上。学习以正确的方式编码并运用您的头脑，而不仅仅是机械地遵循规定的形式。

请注意，比数组更复杂的集合可能需要封闭的类来实现甚至三个以上的方法来访问内部数据结构。

如果要通过包含类（IMO）公开整个数据结构，则需要考虑一下为什么要封装该类，如果不是简单地提供一个更安全的接口-“包装器类”。您说的是为此目的而存在的包含类-因此，您的设计可能不正确。考虑将您的班级细分为更谨慎的模块并进行分层。

一门课程应该有一个明确而谨慎的目的，并提供一个接口来支持该功能，而不再是。您可能正在尝试将不属于一起的东西捆绑在一起。当您这样做时，每次必须实施更改时，事情都会崩溃。您的课程越小越谨慎，就可以更轻松地改变周围的事物：思考乐高。

— 向量
source

1

谢谢回答。一个问题：内部数据结构是否可能具有5种公共方法-所有这些都必须由班级的公共接口来体现？例如，一个Java的ArrayList有如下方法：get(index)，add()，size()，remove(index)，和remove(Object)。使用建议的技术，包含此ArrayList的类必须具有五个公共方法才能委托给内部集合。此类在程序中的用途很可能不是封装此ArrayList，而是执行其他操作。ArrayList只是一个细节。[...]

— 阿维夫·科恩

内部数据结构只是普通成员，使用上面的技术-要求它包含的类具有附加的五个公共方法。您认为-这合理吗？而且-这很常见吗？

— 阿维夫·科恩

@Prog- 如果内部数据结构可能有5个公共方法，该怎么办... IMO如果您发现需要在主类中包装整个助手类并以这种方式公开，则需要重新考虑一下设计-您的公共课程做得太多和/或没有提供适当的接口。一个类应具有非常谨慎和明确定义的角色，并且其界面应仅支持该角色。考虑分解和分层您的课程。一个类不应是以封装名称包含各种对象的“厨房水槽”。

— 矢量

如果要通过包装程序类（IMO）公开整个数据结构，则需要考虑为什么不仅仅为了提供一个更安全的接口而将该类完全封装。您说的是为此目的不存在包含类-因此，此设计有些不对劲。

— 矢量

1

@Phoshi- 关键字是只读 -我可以同意。但是OP并不是在谈论只读。例如remove不是只读的。我的理解是，OP希望将所有内容公开-就像在提议的更改之前的原始代码中public Thing[] getThings(){return things;}那样。这就是我不喜欢的。