在pg。统计学习入门中的 34 :
虽然数学证明超出了本书的范围,有可能表明期望的测试MSE,给定值,总是可以分解为三个基本量的总和:在变化的,平方偏差的和误差项的方差。那是,
[...]方差是指如果我们使用不同的训练数据集来估计变化量。
问题:由于似乎表示函数的方差,因此这在形式上是什么意思?
也就是说,我熟悉随机变量X的方差的概念,但是一组函数的方差又如何呢?可以将其视为函数形式的另一个随机变量的方差吗?
在pg。统计学习入门中的 34 :
虽然数学证明超出了本书的范围,有可能表明期望的测试MSE,给定值,总是可以分解为三个基本量的总和:在变化的,平方偏差的和误差项的方差。那是,
[...]方差是指如果我们使用不同的训练数据集来估计变化量。
问题:由于似乎表示函数的方差,因此这在形式上是什么意思?
也就是说,我熟悉随机变量X的方差的概念,但是一组函数的方差又如何呢?可以将其视为函数形式的另一个随机变量的方差吗?
Answers:
您与@whuber的往来信件是正确的。
可以将学习算法视为更高级别的函数,将训练集映射到函数。
其中是可能的训练集的空间。从概念上讲,这可能有点繁琐,但是基本上每个单独的训练集在使用模型训练算法后都会得到特定函数,该函数可用于在给定数据点进行预测。 ˚F X
如果我们将训练集的空间视为一个概率空间,以便可能的训练数据集存在某种分布,那么模型训练算法就变成了一个函数值随机变量,我们可以想到统计概念。特别地,如果我们固定一个特定的数据点,那么我们将获得数值随机变量
即,首先在上训练算法,然后在处评估结果模型。这只是一个简单的旧的,但在概率空间上巧妙构造的随机变量,因此我们可以谈谈其方差。这是您的ISL公式中的差异。X 0
若要对@Matthew Drury的答案进行视觉/直观解释,请考虑以下玩具示例。
参见下面有关度2和度6的多项式模型的结果图。乍一看,似乎较高的多项式(红色)具有较大的方差。
令和对应于绿色和红色图形,并且是图形的一个实例,呈浅绿色和浅红色。令为沿轴的点数,为图的数量(即模拟的数量)。这里我们有和 ˚F ř ˚F(我)ñX米Ñ=400米=200
我看到三种主要情况
在此玩具示例的情况下,所有三种情况在范围,这证明了高阶多项式拟合(红色)比低阶多项式(绿色)具有更高的方差。
什么当上述三种情况下不应该认为所有持有。例如,如果红色预测的方差平均更大,但不是对所有点都大,该怎么办。
考虑点