在基础机器学习中,我们被教导以下“经验法则”:
a)您数据的大小至少应为假设集的VC维大小的10倍。
b)具有N个连接的神经网络的VC维度约为N.
因此,当深度学习神经网络拥有数百万个单位时,这是否意味着我们应该拥有数十亿个数据点?能否请您对此有所说明?
如您所言,深度神经网络不会拥有数百万个单位。但是,它将有数百万个连接。我认为您的第二个经验法则不适用于这些网络,这主要是由于它们的正规化性质(例如,带有辍学的CNN)。
—
pir
我认为关键是VC绑定不是无限的。如果是有限的,那么PAC理论告诉我们学习是可行的。多少数据,这是另一个问题。
—
弗拉迪斯拉夫(Vladislavs Dovgalecs)2015年