过度拟合的数学/算法定义


18

是否存在关于过度拟合的数学或算法定义?

通常提供的定义是经典的二维点图,其中一条线穿过每个点,而验证损失曲线突然上升。

但是在数学上有严格的定义吗?

Answers:


22

是的,有一个(稍微更多)严格的定义:

给定具有一组参数的模型,如果经过一定数量的训练步骤后,训练误差继续减小而样本外(测试)误差开始增加,则可以说该模型过度拟合了数据。

在此处输入图片说明 在此示例中,样本外(测试/验证)误差首先与火车误差同步降低,然后在第90个时期(即过拟合开始时)开始增加

另一种看待它的方式是偏见和方差。模型的样本外错误可以分解为两个部分:

  • 偏差:由于估算模型的期望值与真实模型的期望值不同而导致的误差。
  • 差异:由于模型对数据集中的细微波动敏感,因此会产生错误。

当偏差低但方差高时,发生过度拟合。对于真实(未知)模型为的数据集:X

Y=f(X)+ϵ -是在数据集中的不可约噪音,具有和, ϵE(ϵ)=0Var(ϵ)=σϵ

估计模型为:

Y^=f^(X)

那么测试错误(对于测试数据点)可以写成:xt

Err(xt)=σϵ+Bias2+Variance

带有 和 Bias2=E[f(xt)f^(xt)]2Variance=E[f^(xt)E[f^(xt)]]2

(严格来说,这种分解适用于回归情况,但类似的分解适用于任何损失函数,即也适用于分类情况)。

以上两个定义都与模型的复杂性有关(根据模型中参数的数量来衡量):模型的复杂性越高,发生过度拟合的可能性就越大。

有关该主题的严格数学处理方法,请参见《统计学习要素》的第7章

在此处输入图片说明 偏置-方差的权衡和方差(即过度拟合)随着模型复杂性的增加而增加。摘自ESL第7章


1
训练和测试误差是否都有可能减少,但模型仍然过拟合?在我看来,训练和测试错误的差异表明过度拟合,但过度拟合并不一定意味着存在差异。例如,通过识别监狱照片的白色背景来学习将罪犯与非罪犯区分开的NN是过拟合的,但是训练和测试错误可能并没有发散。

@在那种情况下,我认为没有任何方法可以衡量发生的过度拟合。您可以访问的只是训练和测试数据,如果两个数据集都展现出NN利用(白色背景)的相同功能,那么这只是一个有效的功能,应该被利用,而不必过度拟合。如果您不想要该功能,则必须在数据集中包含该功能的变体。
卡尔文·戈弗雷

1
@您的示例是我认为的“社会过度拟合”:从数学上讲,该模型并不是过度拟合,但是有一些外部社会考虑因素导致预测变量表现不佳。一个更有趣的例子是一些Kaggle竞赛和各种开放数据集,例如Boston Housing,MNIST等...该模型本身可能并不过分拟合(就偏差,方差等而言),但是其中有很多一般情况下,有关社区问题的知识(以前的团队和研究论文的结果,公开共享的内核等)导致过度拟合。
Skander H.-恢复莫妮卡

1
@yters(续),因此,理论上,一个单独的验证数据集(除了测试数据集)应保留在“保险库”中,直到最终验证之前才使用。
Skander H.-恢复莫妮卡

1
@CalvinGodfrey这是一个更具技术性的示例。假设我有一个在两个类之间平均分配的二进制分类数据集,然后将噪声从相当不平衡的伯努利分布添加到分类中,从而使数据集偏向其中一个分类。我将数据集拆分为训练并进行测试,部分是由于分布不平衡,因此两者均实现了较高的准确性。但是,由于该模型学习了偏斜的伯努利分布,因此在真正的数据集分类上,该模型的准确性并不高。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.