您的定义似乎是正确的。
关于这些问题的书是《统计间隔》(Gerald Hahn和William Meeker),1991年。我引用:
单个未来观察的预测间隔是一个具有指定置信度的间隔,它将包含从总体中随机选择的下一个(或一些其他预先指定的)观察。
[A]公差区间是一个区间,可以声称该区间包含指定比例的人口中具有指定置信度的人口的至少指定比例p。100 (1 - α )%
这是标准数学术语的重述。让数据被认为是具有共同累积分布函数的独立随机变量。(似乎是在提醒您,可能是未知的,但假定位于给定的一组分布)。令是另一个具有相同分布且独立于前变量的随机变量。X = (X 1,... ,X Ñ)˚F θ θ ˚F ˚F θ | θ ∈ Θ X 0 ˚F θ Ñx =( x1个,… ,xñ)X =( X1个,… ,Xñ)FθθFFθ|θ∈ΘX0Fθn
甲预测区间由端点给出(对于单未来观察),,具有限定属性,该属性[l(x),u(x)]
infθ{Prθ(X0∈[l(X),u(X)])}=100(1−α)%.
具体而言,指的是由定律确定的的变量分布。请注意,没有任何条件概率:这是一个完整的联合概率。还要注意,在时间上没有任何参考:可能在其他值之前及时被观察到。不要紧。 Ñ+1( X 0, X 1,..., X Ñ) ˚F θ X 0Prθn+1(X0,X1,…,Xn)FθX0
我不确定这可能是“违反直觉的”。如果我们打算选择统计程序作为收集数据之前要进行的活动,那么这是计划的两步过程的自然而合理的表述,因为这两个数据()而“未来值”需要建模为随机模型。X 0Xi,i=1,…,nX0
甲公差区间,通过端点给出,具有限定属性,该属性(L(x),U(x)]
infθ{Prθ(Fθ(U(X))−Fθ(L(X))≥p)}=100(1−α)%.
请注意,没有任何对引用:它。X0
当是正态分布的集合时,存在以下形式的预测间隔{Fθ}
l(x)=x¯−k(α,n)s,u(x)=x¯+k(α,n)s
(是样本均值,是样本标准差)。Hahn&Meeker列表的函数值不依赖于数据。 即使在正常情况下,也存在其他预测间隔过程:这些不是唯一的过程。小号ķXx¯skx
同样,存在以下形式的公差区间
L(x)=x¯−K(α,n,p)s,U(x)=x¯+K(α,n,p)s.
还有其他公差间隔程序:这些不是唯一的程序。
注意这对公式之间的相似性,我们可以求解方程
k(α,n)=K(α′,n,p).
这样一来,您就可以将预测间隔重新解释为公差间隔(通过改变和以许多不同的可能方式),也可以将公差间隔重新解释为预测间隔(仅现在,通常由和)。 这可能是造成混乱的原因之一。 p α α ' pα′pαα′p