RMSE的置信区间


20

我从总体中抽取了数据点的样本。这些点中的每一个都有一个真实值(从基本事实中获知)和一个估计值。然后,我计算每个采样点的误差,然后计算样本的均方根误差。ñ

然后,如何根据样本大小推断此RMSE的某种置信区间?ñ

如果我使用均值而不是RMSE,那么我这样做就不会有问题,因为我可以使用标准方程式

=žσñ

但我不知道这对RMSE是否有效,而不是平均值。有什么办法可以使我适应吗?

(我已经看到了这个问题,但是我的人口是否分布正常没有问题,这就是那里的答案)


当您“计算样本的RMSE”时,您要具体计算什么?它是对的RMSE 真值,对的估计值,或者它们的区别是什么?
Whuber

2
我正在计算差异的均方根误差,即计算真实值与估算值之间平方差的均值的平方根。
robintw

如果您知道“基本事实”(尽管我不确定这实际上意味着什么),那么为什么需要RMSE中的不确定性?您是否要对没有基本事实的情况进行某种推断?这是校准问题吗?
Glen_b-恢复莫妮卡

@Glen_b:是的,这正是我们想要做的。我们没有整个人口的基本事实,只是样本。然后,我们正在为样本计算均方误差,并且我们希望对此有一个置信区间,因为我们正在使用此样本来推断总体的均方误差。
robintw

Answers:


15

使用与此处类似的推理,在某些情况下,我也许可以回答您的问题。

令是您的第数据点的真实值,并是估计值。如果我们假设估算值与真实值之间的差异为ħ XX一世一世ŤHX^一世

  1. 均值零(即分布在周围)XX^一世X一世

  2. 服从正态分布

  3. 并具有相同的标准偏差σ

简而言之:

X^一世-X一世ñ0σ2

那么您真的想要的置信区间。σ

如果以上假设均成立 遵循分布,其中(不是)度为自由。这意味着 χ 2 Ñ ÑÑ-1

ñRMSE2σ2=ñ1个ñ一世X一世^-X一世2σ2
χñ2ññ-1个

Pχα2ñ2ñRMSE2σ2χ1个-α2ñ2=1个-αPñRMSE2χ1个-α2ñ2σ2ñRMSE2χα2ñ2=1个-αPñχ1个-α2ñ2RMSEσñχα2ñ2RMSE=1个-α

因此, 是您的置信区间。

[ñχ1个-α2ñ2RMSEñχα2ñ2RMSE]

这是一个模拟您情况的python程序

from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
    y[i] =sqrt( mean((random.randn(n)*s)**2))

print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)

希望能有所帮助。

如果不确定这些假设是否适用,或者不确定是否要将我写的内容与其他方法进行比较,则可以随时尝试使用bootstrapping


1
我认为您错了-他希望CI代表RMSE,而不是。而且我也想要它:)σ
好奇

1
我认为我没有错。只需这样考虑:由于。唯一的区别是您要除以而不是因为这里没有减去样本均值。然后,RMSE对应于。因此,总体RMSE为,您需要一个CI。这就是我得出的。否则,我必须完全误解您的问题。Ññ-1σσ微软=σ^2=1个ñ一世=1个ñX一世-X^一世2ññ-1个σσ
fabee

10

如果将其应用于STDE(误差的标准偏差)而不是RMSE,则fabee 答案中的推理似乎是正确的。使用类似的命名法,是代表每个数据记录的索引,是真实值,是度量或预测。X X一世=1个ñX一世X^一世

错误,BIAS,MSE(均方误差)和RMSE由以下公式给出: ϵ一世

ϵ一世=X^一世-X一世偏压=ϵ¯=1个ñ一世=1个ñϵ一世微软=ϵ2¯=1个ñ一世=1个ñϵ一世2RMSE=微软

同意这些定义,BIAS对应于的样本均值,但MSE并非偏差样本方差。而是: 或者,如果同时计算了BIAS和RMSE,则 注意,偏置样本方差被用于代替无偏,以保持一致性与用于MSE和RMSE给出的前面的定义。ϵ

STDE2=ϵ-ϵ¯2¯=1个ñ一世=1个ñϵ一世-ϵ¯2
STDE2=ϵ-ϵ¯2¯=ϵ2¯-ϵ¯2=RMSE2-偏压2

因此,在我看来,fabee建立的置信区间指的是,STDE 的样本标准偏差。类似地,可以基于z分数(如果则为t分数)和为BIAS建立置信区间。ϵñ<30STDE/ñ


2
您说得对,但错过了我的部分答案。我基本上假设BIAS = 0(请参阅假设1)。在这种情况下, 您导出的。由于和均为并且存在两个 RV 的和的近似形式解,因此对于假设1掉落的情况,您可能可以得出近似形式置信区间。如果您这样做并更新了答案,我一定会赞成。[R中号小号Ë2=小号ŤdË2[R中号小号Ë2一世一种小号2χ2χ2
fabee 2015年

0

Faaber 1999之后,RMSE的不确定度表示为 ,其中是数据点的数量。

σ[R中号小号Ë^/[R中号小号Ë=1个2ñ
ñ
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.