首先,让我们给出置信区间的定义,或者在维数大于1的空间中,给出置信区间。该定义是Jerzy Neyman在1937年致皇家学会的论文中给出的简明版本。
令参数为,而统计量为。每个可能的参数值与一个接受区域关联,为此,其中为置信度或置信度(通常为0.95),而为背景信息,我们必须定义概率。该置信区域给出的,,然后。pspA(p,α)prob(s∈A(p,α)|p=p,I)=ααIps=sC(s,α)={p|s∈A(p,α)}
换句话说,形成置信区域的参数值就是那些其样本空间的对应概率区域包含统计信息的参数值。α
现在考虑对于任何可能的参数值:p
∫[p∈C(s,α)]prob(s=s|p=p,I)ds=∫[s∈A(p,α)]prob(s=s|p=p,I)ds=α
其中方括号是Iverson括号。这是置信区间或区域的关键结果。它说的期望在条件下的采样分布为。该结果由接受区域的构造来保证,而且适用于,因为是可能的参数值。但是,这不是关于的概率陈述,因为期望不是概率![p∈C(s,α)]pαppp
期望值通常被误认为的概率是在条件下该参数位于置信区域内的概率:s=s
prob(p∈C(s,α)|s=s,I)=∫C(s,α)prob(s=s|p=p,I)prob(p=p|I)dp∫prob(s=s|p=p,I)prob(p=p|I)dp
仅对于信息和接受区域某些组合,此概率降低为。例如,如果先验是均匀的并且采样分布在和是对称(例如,以为平均值的高斯),则:αIA(p,α)spp
prob(p∈C(s,α)|s=s,I)=∫C(s,α)prob(s=p|p=s,I)dp∫prob(s=p|p=s,I)dp=prob(s∈C(s,α)|p=s,I)=prob(s∈A(s,α)|p=s,I)
此外,如果接受区域是,则:s∈A(s,α)⟺s∈A(s,α)
prob(p∈C(s,α)|s=s,I)=prob(s∈A(s,α)|p=s,I)=α
在上述假设的特殊情况下,教科书示例使用标准的统计量构建具有标准置信区间的总体平均值。因此,标准的95%置信区间确实包含均值为0.95的均值;但这种对应关系通常不成立。