预测和公差区间


11

对于预测和公差区间,我有几个问题。

首先让我们就容忍区间的定义达成一致:给我们一个置信度,例如90%,要捕获的总体百分比,例如99%,样本量,例如20。概率分布是已知的,例如正态为了方便。现在,考虑到上述三个数字(90%,99%和20)以及基础分布为正态的事实,我们可以计算公差数。给定具有均值和标准偏差的样本,公差区间为。如果此公差区间捕获了99%的人口,则样本被称为成功k(x1,x2,,x20)x¯sx¯±ks(x1,x2,,x20)并且要求90%的样本是成功的

评论:90%是样本成功的先验概率。假设样本成功,则99%是有条件的概率,将来的观察将在公差区间内。

我的问题:我们可以将预测间隔视为公差间隔吗?在网上浏览时,我对此有矛盾的答案,更不用说没有人真正仔细地定义预测间隔了。因此,如果您对预测间隔(或参考)有精确的定义,我将不胜感激。

我了解的是,例如99%的预测间隔不会捕获所有样本的所有将来值的99%。这与以100%的概率捕获99%的总体的公差区间相同。

在我发现的90%预测间隔的定义中,90%是给定样本(大小固定)单个未来观察值的先验概率,即将在预测间隔内。因此,与容差区间相反,似乎在同一时间给出了样本和终值,而公差区间是在给出样本的情况下以一定的概率成功的,并且在一个成功y y(x1,x2,,x20)yy,则给出一个未来值,并以一定的概率落入公差区间。我不确定上述预测间隔的定义是否正确,但是(至少)似乎违反直觉。

有什么帮助吗?


4
正常采样的单边公差间隔可能有助于理解这一概念。上部公差的约束只不过是信心上的约束的的模型的假定分布的-quantile。因此,在正态分布的情况下,这是参数置信度上限,其中是标准高斯分布的。99 μ + ķ σ ķ = ž 99 99 99%99%μ+kσk=z99%99%
斯特凡洛朗

这是一个很好的重新配制,斯特凡,因为它会立即显示有几种公差范围:一,可以要求一个上的置信度,对于较低的置信度上,或(例如)对该参数进行无偏估计。在文献中,这三个都称为“公差极限”。μ + ž 0.99 σμ+z0.99σμ+z0.99σ
whuber

我认为您想对设置较低的置信度?μz0.99σ
斯蒂芬·洛朗

2
实际上,不,史黛芬(这就是为什么我要重复参数的公式的原因)。对于较低的公差极限,也有三个类似的定义。例如,我们可能要到 -estimate上部第99百分位数的人口,但要控制的低估,我们坚持会有(比如说)5%的机会,我们的低估仍然太高量。这将使我们可以这样说:“数据以95%的置信度表明,该人口的99%超过了某某值。”
whuber

Answers:


14

您的定义似乎是正确的。

关于这些问题书是《统计间隔》(Gerald Hahn和William Meeker),1991年。我引用:

单个未来观察的预测间隔是一个具有指定置信度的间隔,它将包含从总体中随机选择的下一个(或一些其他预先指定的)观察。

[A]公差区间是一个区间,可以声称该区间包含指定比例的人口中具有指定置信度的人口的至少指定比例p100(1α)%

这是标准数学术语的重述。让数据被认为是具有共同累积分布函数的独立随机变量。(似乎是在提醒您,可能是未知的,但假定位于给定的一组分布)。令是另一个具有相同分布且独立于前变量的随机变量。X = X 1... X Ñ˚F θ θ ˚F ˚F θ | θ ∈ Θ X 0 ˚F θ Ñx=(x1,,xn)X=(X1,,Xn)FθθFFθ|θΘX0Fθn

  1. 预测区间由端点给出(对于单未来观察),,具有限定属性,该属性[l(x),u(x)]

    infθ{Prθ(X0[l(X),u(X)])}=100(1α)%.

    具体而言,指的是由定律确定的的变量分布。请注意,没有任何条件概率:这是一个完整的联合概率。还要注意,在时间上没有任何参考:可能在其他值之前及时被观察到。不要紧。 Ñ+1 X 0 X 1... X Ñ ˚F θ X 0Prθn+1(X0,X1,,Xn)FθX0

    我不确定这可能是“违反直觉的”。如果我们打算选择统计程序作为收集数据之前要进行的活动,那么这是计划的两步过程的自然而合理的表述,因为这两个数据()而“未来值”需要建模为随机模型。X 0Xi,i=1,,nX0

  2. 公差区间,通过端点给出,具有限定属性,该属性(L(x),U(x)]

    infθ{Prθ(Fθ(U(X))Fθ(L(X))p)}=100(1α)%.

    请注意,没有任何对引用:它。X0

当是正态分布的集合时,存在以下形式的预测间隔{Fθ}

l(x)=x¯k(α,n)s,u(x)=x¯+k(α,n)s

(是样本均值,是样本标准差)。Hahn&Meeker列表的函数值不依赖于数据。 即使在正常情况下存在其他预测间隔过程:这些不是唯一的过程。小号ķXx¯skx

同样,存在以下形式的公差区间

L(x)=x¯K(α,n,p)s,U(x)=x¯+K(α,n,p)s.

还有其他公差间隔程序:这些不是唯一的程序。

注意这对公式之间的相似性,我们可以求解方程

k(α,n)=K(α,n,p).

这样一来,您就可以预测间隔重新解释为公差间隔(通过改变和以许多不同的可能方式),也可以公差间隔重新解释为预测间隔(仅现在,通常由和)。 这可能是造成混乱的原因之一。 p α α ' pαpααp


2
这些间隔之间的混淆是真实的。十年前,我与一位不了解这种差异并且(几乎)无法识别差异的政府统计人员进行了几次艰难的交谈。她在创建指导,审阅报告,为案例工作者提供咨询,分发软件,甚至经过同行评审的出版物方面发挥了重要作用,这促进了这些误解的延续。所以要当心!
whuber

非常好的答案,谢谢。我很高兴一些统计学家说预测间隔是的公差间隔。这个想法背后有真实的事实吗?换句话说,是否真的或类似的东西?k α n = K α n 0.5 p=50%k(α,n)=K(α,n,0.5)
斯特凡洛朗

3
不,@Stéphane不是。为了弄清楚为什么不这样做,请考虑具有非常大的和中等置信度(例如95%)的情况。因此,在,两侧公差间隔应非常接近分布的中间50%,因此根据定义,位于其中的可能性只有50%,而不是所需的95%。那是巨大的差异!直觉上,对95%的人群的容忍区间应接近95%置信度的预测区间,但他们仍然不完全同意。p = 50 X 0np=50%X0
whuber

我刚刚考虑过这一点,我相信事实是这样的:当大时。当是借助非中心t分布给出的经典公差因子时,这很容易看出(位数是非中心参数) ñķ50ž1-α/k(α,n)K(50%,n,1α)nK50%z1α/n
斯特凡洛朗

@whuber。谢谢你的回答。在将其标记为正确之前,我必须确保自己理解。给我一些时间来“消化”它。
Ioannis Souldatos'4

1

据我了解,对于正常的公差极限,来自非中心t百分位数。显然,就W Huber而言,有些统计学家对公差极限与预测极限的概念并不熟悉。宽容的想法似乎主要出现在工程设计和制造中,而不是临床生物统计学。缺乏对公差区间的了解以及对预测区间的困惑的原因可能是人们接受其统计训练的背景。K(α,p)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.