根据测量误差选择先验


9

如果您有仪器的测量误差,如何计算适当的先验值?本段摘自Cressie的书“时空数据统计”:

通常情况下,可以使用一些有关测量误差方差的先验信息,从而可以指定相当有用的参数模型。例如,如果我们假设条件独立的测量误差为iid ,那么我们应该为指定一个信息先验。假设我们对环境空气温度感兴趣,并且我们看到仪器制造商的技术指标表明“误差”为±0.1°C。假定此“错误”对应于2个标准差(应检查的假设!),然后我们可以指定\ sigma _ {\ epsilon} ^ {2}的先前平均值为(0.1 / 2)^ 2 = 0.0025Gau(0,σϵ2)σϵ2±0.1°Cσϵ2(0.1/2)2=0.0025。由于仪器制造商的规范,我们假设分布在0.0025处具有明确定义且相当窄的峰(例如,反伽马)。实际上,我们可以将其固定为0.0025;但是,数据模型错误也可能具有其他不确定性因素(第7.1节)。为避免过程模型错误可能引起的可识别性问题,建模人员应尽可能减少《科学》杂志的不确定性,包括进行旨在复制数据的辅助研究,这一点非常重要。

有谁知道如上所述获得先验值的一般程序是什么(尽管该段仅涉及获得先验均值)?

Answers:


6

两种标准方法

  1. 参阅报价单中所示的“仪器制造商的规格”。当没有其他可用信息时,通常会使用这种粗略的回退,因为(a)仪器制造商对“准确度”和“精确度”的真正含义通常是不确定的,以及(b)仪器在刚投入使用时的响应方式测试实验室可能比在现场使用时要好得多。

  2. 收集重复样本。 在环境采样中,大约有六个级别可以常规复制样本(还有多个可以复制的级别),每个级别都用于控制可分配的变异源。这些来源可能包括:

    • 采样者的身份。
    • 在获取样品之前采取的初步程序,例如取水井。
    • 物理采样过程中的可变性。
    • 样品体积本身的异质性。
    • 保存和运送样品到实验室时可能发生的变化。
    • 初步实验室程序的各种变化,例如均质样品或将其消化以进行分析。
    • 实验室分析人员的身份。
    • 实验室之间的差异。
    • 物理上不同的仪器(例如两个气相色谱仪)之间的差异。
    • 仪器校准会随时间推移而漂移。
    • 日变化。(这可能是自然而系统的,但在采样时间为任意时可能会随机出现。)

只有根据适当的实验设计系统地改变这些因素中的每一个,才能获得对变异性成分的完整定量评估。

通常,仅研究被认为贡献最大的来源。例如,许多研究一旦获得样本,就会有系统地分割样本的一部分,然后将其运送到两个不同的实验室。对这些拆分结果之间差异的研究可以量化其对度量变异性的贡献。如果获得足够多的此类拆分,则可以在分层贝叶斯时空模型中先验地估计测量变异性的全部分布。因为许多模型都假设高斯分布(针对每个计算),所以获得高斯先验最终将归结为估算拆分之间差异的均值和方差。在旨在识别多个方差成分的更复杂的研究中,

甚至考虑这些问题的好处之一是,它们可以帮助您找到减少甚至消除错误的某些组成部分的方式(而不必量化它们),从而更加接近Cressie&Wikle的“减少不确定性”的理想。在科学允许的范围内。”

有关扩展的工作示例(在土壤采样中),请参见

Van Ee,Blume和Starks,《土壤取样误差的评估基础》。 美国EPA,1990年5月:EPA / 600 / 4-90 / 013。


2
罗伯特(Robert)的问题是,有时有人会报告的标准差作为估算值​​。其他时候,他们将报告两次(因此除以2)或双向置信区间;有时甚至是其他东西;因此,没有明确的规则可将准确度和精确度的陈述转换为先验:您必须查阅脚注和其他技术细节,才能准确地了解数字所代表的含义。估计的标准误差与所用样本的大小有关,与BTW无关。
ub

1
得到它了。让我将焦点转移到您的第二种情况。如果我重复几次实验并获得测量值和 ,如何使用此信息来告知先前分布的均值和方差?您为多个拆分建议了类似的内容,对吗?因此,我将得到一个测量误差和一个样本标准偏差平均值。是否足以将其包括在先前的?m1m2m1m2mϵσϵN(mϵ,σϵ2)
罗伯·史密斯

1
您无法通过拆分来评估准确性:为此,您需要测量已知值的样本。(为此使用实验室尖峰尖峰重复项。)这将确定平均值。通常在校准测量过程时会处理此问题,因此将平均值视为零。使用通常的方差分析公式估算方差。您可以使用它在度量系统的相应组件上指定先验。

2
事实并非如此:我提供的参考是已经有25年历史的美国EPA指南,并且在其思想的基础上还有许多最新的指南。我曾经在联邦法院的一个案例中使用此方法来评估测量误差对绘制轮廓线(基于地统计预测器)以描绘污染物羽流的影响:测量误差大于约束羽流的浓度!(换句话说,羽状
轮廓

1
非常好。顺便说一句,我的意思是说先验通常是在没有太多照顾的情况下确定的。在贝叶斯建模和机器学习中,我已经更加明显地看到了这一点,这也许是因为猜测通常足以产生不错的结果。
罗伯·史密斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.