我从总体中抽取了数据点的样本。这些点中的每一个都有一个真实值(从基本事实中获知)和一个估计值。然后,我计算每个采样点的误差,然后计算样本的均方根误差。
然后,如何根据样本大小推断此RMSE的某种置信区间?
如果我使用均值而不是RMSE,那么我这样做就不会有问题,因为我可以使用标准方程式
但我不知道这对RMSE是否有效,而不是平均值。有什么办法可以使我适应吗?
(我已经看到了这个问题,但是我的人口是否分布正常没有问题,这就是那里的答案)
我从总体中抽取了数据点的样本。这些点中的每一个都有一个真实值(从基本事实中获知)和一个估计值。然后,我计算每个采样点的误差,然后计算样本的均方根误差。
然后,如何根据样本大小推断此RMSE的某种置信区间?
如果我使用均值而不是RMSE,那么我这样做就不会有问题,因为我可以使用标准方程式
但我不知道这对RMSE是否有效,而不是平均值。有什么办法可以使我适应吗?
(我已经看到了这个问题,但是我的人口是否分布正常没有问题,这就是那里的答案)
Answers:
使用与此处类似的推理,在某些情况下,我也许可以回答您的问题。
令是您的第数据点的真实值,并是估计值。如果我们假设估算值与真实值之间的差异为我吨ħ X我
均值零(即分布在周围)X我
服从正态分布
并具有相同的标准偏差
简而言之:
那么您真的想要的置信区间。
如果以上假设均成立 遵循分布,其中(不是)度为自由。这意味着 χ 2 Ñ ÑÑ-1
因此, 是您的置信区间。
这是一个模拟您情况的python程序
from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
y[i] =sqrt( mean((random.randn(n)*s)**2))
print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)
希望能有所帮助。
如果不确定这些假设是否适用,或者不确定是否要将我写的内容与其他方法进行比较,则可以随时尝试使用bootstrapping。
如果将其应用于STDE(误差的标准偏差)而不是RMSE,则fabee 答案中的推理似乎是正确的。使用类似的命名法,是代表每个数据记录的索引,是真实值,是度量或预测。X 我X我
错误,BIAS,MSE(均方误差)和RMSE由以下公式给出:
同意这些定义,BIAS对应于的样本均值,但MSE并非偏差样本方差。而是: 或者,如果同时计算了BIAS和RMSE,则 注意,偏置样本方差被用于代替无偏,以保持一致性与用于MSE和RMSE给出的前面的定义。
因此,在我看来,fabee建立的置信区间指的是,STDE 的样本标准偏差。类似地,可以基于z分数(如果则为t分数)和为BIAS建立置信区间。