这应该使用贝叶斯推理轻松解决。您知道各个点相对于其真实值的测量属性,并且想要推断生成真实值的总体平均值和SD。这是一个层次模型。
改写问题(贝叶斯基础知识)
请注意,尽管正统统计量为您提供了一个均值,但在贝叶斯框架中,您可以得到可靠的均值分布。例如,具有SD值(2、2、3)的观测值(1、2、3)可能是通过最大似然估计值为2生成的,但也可能是平均2.1或1.8生成的,尽管(从数据来看)可能性要小一些MLE。因此,除了SD之外,我们还可以推断均值。
另一个概念上的差异是,您必须在进行观察之前定义知识状态。我们称此为先验。您可能事先知道在一定高度范围内扫描了某个区域。完全不了解知识的地方将是在X和Y方向上具有先验的(-90,90)度,并且可能在高度上(在海洋之上,在地球的最高点以下)高度为(0,10000)米。您必须为要估计的所有参数定义先验分布,即获取其后验分布。标准偏差也是如此。
因此,改写您的问题,我假设您要推断三个均值(X.mean,Y.mean,X.mean)和三个标准差(X.sd,Y.sd,X.sd)的可信值生成了您的数据。
该模型
使用标准的BUGS语法(使用WinBUGS,OpenBUGS,JAGS,stan或其他程序包运行此语法),模型将如下所示:
model {
# Set priors on population parameters
X.mean ~ dunif(-90, 90)
Y.mean ~ dunif(-90, 90)
Z.mean ~ dunif(0, 10000)
X.sd ~ dunif(0, 10) # use something with better properties, i.e. Jeffreys prior.
Y.sd ~ dunif(0, 10)
Z.sd ~ dunif(0, 100)
# Loop through data (or: set up plates)
# assuming observed(x, sd(x), y, sd(y) z, sd(z)) = d[i, 1:6]
for(i in 1:n.obs) {
# The true value was generated from population parameters
X[i] ~ dnorm(X.mean, X.sd^-2) #^-2 converts from SD to precision
Y[i] ~ dnorm(Y.mean, Y.sd^-2)
Z[i] ~ dnorm(Z.mean, Z.sd^-2)
# The observation was generated from the true value and a known measurement error
d[i, 1] ~ dnorm(X[i], d[i, 2]^-2) #^-2 converts from SD to precision
d[i, 3] ~ dnorm(Y[i], d[i, 4]^-2)
d[i, 5] ~ dnorm(Z[i], d[i, 6]^-2)
}
}
自然地,您监视.mean和.sd参数,并使用它们的后验进行推断。
模拟
我模拟了一些数据,如下所示:
# Simulate 500 data points
x = rnorm(500, -10, 5) # mean -10, sd 5
y = rnorm(500, 20, 5) # mean 20, sd 4
z = rnorm(500, 2000, 10) # mean 2000, sd 10
d = cbind(x, 0.1, y, 0.1, z, 3) # added constant measurement errors of 0.1 deg, 0.1 deg and 3 meters
n.obs = dim(d)[1]
然后在500次迭代的老化之后,使用JAGS对2000次迭代运行模型。这是X.sd的结果。
蓝色范围表示最高后验密度或可信区间为95%(您认为该参数是在观察数据后得出的。请注意,正统的置信区间不会为您提供此值)。
红色垂直线是原始数据的MLE估计值。通常,贝叶斯估计中最可能的参数也是正统统计量中最可能的(最大似然)参数。但是,您不必太在意后部的顶部。如果要将平均值简化为一个数字,则平均值或中位数更好。
请注意,MLE /顶部不是5,因为数据是随机生成的,而不是因为统计信息错误。
局限性
这是一个简单的模型,目前存在一些缺陷。
- 它不能处理-90度和90度的标识。但是,这可以通过做一些中间变量来完成,该变量将估计参数的极值移到(-90,90)范围内。
- 尽管X,Y和Z可能相互关联,但目前已将它们建模为独立的,因此应将其考虑在内,以充分利用数据。这取决于测量设备是在移动(X,Y和Z的序列相关性和联合分布将为您提供很多信息)还是静止不动(独立无妨)。如果需要,我可以扩展答案以解决此问题。
我应该提到,关于空间贝叶斯模型的文献很多,我对此并不了解。