...预期的[平方误差]损失可以分解为平方偏差项(描述平均预测与真实模型之间的距离),方差项(描述预测在平均值附近的分布)和噪声项(给出数据的固有噪声)。
当查看平方误差损失分解
我只看到两个术语:一个用于偏差,另一个用于估计器或预测器方差。预期损耗中没有额外的噪声项。应该指出的是,变异性是的变异性,而不是样本本身的变异性。δ
Eθ[(θ−δ(X1:n))2]=(θ−Eθ[δ(X1:n)])2+Eθ[(Eθ[δ(X1:n)]−δ(X1:n))2]
δ (X 1 :n)δ(X1:n)δ(X1:n)
- 可以使用除平方损失以外的损失函数执行偏差方差分解吗?
我对偏差平方和方差分解的平方(以及我的教授方式)的解释是,这是毕达哥拉斯定理的统计等价物,即,估计量与某个集合内某个点之间的平方距离是平方距离的总和估计值和集合之间的距离,加上集合上正交投影与集合内点之间的平方距离。对于给定的模型数据集,基于n的距离的任何损失都存在一个以上的模型,其预期损失在所有模型中都是最小的,如果是这样,这是否意味着可能存在偏差和方差的不同组合,从而产生了正交投影的最小期望损失相同,即内积,即本质上为希尔伯特空间,满足了这种分解。
- 对于给定的模型数据集,是否有多个模型的预期损失在所有模型中均是最小的,如果是这样,是否意味着可能会有不同的偏差和方差组合产生相同的最小预期损失?
问题尚不清楚:如果至少用模型来表示
那么有很多示例具有恒定预期损失(或风险)的统计模型和相关决策。以正常均值的MLE为例。
minθEθ[(θ−δ(X1:n))2]
- 如果您不知道真实的模型,如何计算偏差?
在一般意义上,偏差是假设模型中的真实模型与最接近模型之间的距离。如果真实模型未知,则可以通过自举确定偏差。
- 在某些情况下,将偏差或方差最小化而不是预期损失(偏差和方差的平方和)更有意义吗?
考虑其他损失函数时,如
将推为零会将大部分评估置于偏见上,而将推至无穷大则会切换专注于差异。
(θ−Eθ[δ(X1:n)])2+α[(Eθ[δ(X1:n)]−δ(X1:n))2]0<α
αα