我正在尝试了解偏差-方差折衷,估算器的偏差与模型的偏差之间的关系以及估算器的方差与模型的方差之间的关系。
我得出以下结论:
- 当我们忽略估计量的偏差时,即当我们仅旨在最小化模型偏差而不考虑模型的方差时,我们倾向于过度拟合数据(换句话说,我们仅旨在最小化估计量的方差而不考虑估计量的偏差)
- 反之亦然,当我们忽略估计量的方差时,即当我们仅旨在最小化模型方差而忽略模型的偏差时,我们倾向于使数据拟合不足(换句话说,我们仅旨在最小化模型的偏差)。估算器,也无需考虑估算器的方差)。
我的结论正确吗?
我正在尝试了解偏差-方差折衷,估算器的偏差与模型的偏差之间的关系以及估算器的方差与模型的方差之间的关系。
我得出以下结论:
我的结论正确吗?
Answers:
好吧,有点。如前所述,您将意图归因于科学家以最小化偏差或方差。实际上,您不能显式观察模型的偏差或方差(如果可以的话,您将知道真实的信号,在这种情况下,您将不需要模型)。通常,您只能在特定数据集上观察模型的错误率,并且您尝试使用各种创意技术来估计样本外错误率。
现在你也知道,至少在理论上,这个误差率可以分解为偏差和方差方面,但你不能直接观察到在任何特定的具体情况,这种平衡。因此,我稍微重申一下您的观察结果:
通常,没有确定的确切方法,因为您永远无法真正观察到模型偏差。尽管如此,仍有多种行为模式表明处于一种或另一种情况:
这些是通过模型复杂性在著名的错误率图中显示的模式,该模式来自《统计学习的要素》:
通常,这些图覆盖有偏差和方差曲线。我是从这个不错的博览会上摘下来的:
但是,非常重要的是要意识到,在任何现实情况下,您都从未真正看到这些附加曲线。
正如@Matthew Drury所指出的,在现实情况下,您看不到最后一张图,但是以下玩具示例可能为那些认为有帮助的人提供视觉解释和直觉。
直观上,您会期望直线曲线表现不佳,因为数据集显然是非线性的。同样,拟合非常高的多项式可能会过多。直觉反映在下图中,该图显示了各种模型及其对应的火车和测试数据均方误差。
上图适用于单个火车/测试区,但是我们如何知道它是否可以推广?
这里我们有很多选择,但是一种方法是在训练/测试之间随机分割数据-使模型适合给定的分割,然后重复多次此实验。可以绘制所得的MSE,平均值是预期误差的估计值。
有趣的是,测试MSE随数据的不同训练/测试拆分而剧烈波动。但是,对足够多的实验取平均值可以使我们更有信心。
请注意显示方差的灰色虚线了开始时计算。看来,平均的测试MSE是永远不会低于此值
如前所述 处所述,MSE可以分为3个主要组成部分:
在我们的玩具盒中:
提供以下关系
注意:上图使用训练数据拟合模型,然后计算train + test的MSE。