Answers:
是的,有一个(稍微更多)严格的定义:
给定具有一组参数的模型,如果经过一定数量的训练步骤后,训练误差继续减小而样本外(测试)误差开始增加,则可以说该模型过度拟合了数据。
在此示例中,样本外(测试/验证)误差首先与火车误差同步降低,然后在第90个时期(即过拟合开始时)开始增加
另一种看待它的方式是偏见和方差。模型的样本外错误可以分解为两个部分:
当偏差低但方差高时,发生过度拟合。对于真实(未知)模型为的数据集:
-是在数据集中的不可约噪音,具有和,
估计模型为:
,
那么测试错误(对于测试数据点)可以写成:
带有 和
(严格来说,这种分解适用于回归情况,但类似的分解适用于任何损失函数,即也适用于分类情况)。
以上两个定义都与模型的复杂性有关(根据模型中参数的数量来衡量):模型的复杂性越高,发生过度拟合的可能性就越大。
有关该主题的严格数学处理方法,请参见《统计学习要素》的第7章。