在正式得出估计的置信区间的同时,我得出了一个公式,该公式与值的计算方式非常相似。
因此,问题是:它们在形式上等效吗?即拒绝假设的临界值等于不属于具有临界值\ alpha的置信区间。α 0 α
在正式得出估计的置信区间的同时,我得出了一个公式,该公式与值的计算方式非常相似。
因此,问题是:它们在形式上等效吗?即拒绝假设的临界值等于不属于具有临界值\ alpha的置信区间。α 0 α
Answers:
是的,没有。
您所观察到的是,当测试和置信区间基于相同的统计量时,它们之间是等效的:我们可以将值解释为的最小值,其中参数的空值将包含在置信区间中。α 1 - α
令为参数空间的未知参数,并让样本是随机变量。为简单起见,将置信区间定义为随机区间,以使其覆盖概率 (您可以类似地考虑更一般的间隔,其中覆盖率概率以为边界或近似等于。推理类似。)Θ ⊆ - [R X = (X 1,... ,X Ñ)∈ X ñ ⊆ ř Ñ X = (X 1,... ,X Ñ)我α(X)P θ(θ ∈ 我α(X))= 1 - α 1 - α
考虑针对零点假设对于替代项。令表示测试的p值。对于任何,如果则在级别拒绝。级别拒绝区域是的集合,导致拒绝: ħ 1(θ 0):θ ≠ θ 0 λ (θ 0,X)α ∈ (0 ,1 )H ^ 0(θ 0)α λ (θ 0,X )≤ α α α(θ 0)= { X ħ 0(θ 0)- [R
现在,考虑对进行p值的双面测试。对于这样的族,我们可以定义一个反向拒绝区域θ ∈ Θ
对于任何固定的,如果,则被拒绝,这仅当且仅当发生时,也就是说, 如果测试基于具有完全指定的绝对连续零分布的测试统计信息,则在。然后 由于式适用于任何ħ 0(θ 0)X ∈ [R α(θ 0)θ 0 ∈ Q α(X)X ∈ [R α(θ 0)⇔ θ 0 ∈ Q α(X)。λ (θ 0,X)〜ù(0 ,1 )H ^ 0(θ 0
下面给出了一个说明,显示了对于正常平均值的检验所对应的拒绝区域和置信区间,对于不同的null平均值和不同的样本平均值(。如果在浅灰色阴影区域中则被拒绝。深灰色显示拒绝区域和置信区间。
(其中大部分来自我的博士学位论文。)
上面我描述了构建置信区间的标准方法。在这种方法中,我们使用与未知参数相关的一些统计信息来构造间隔。也有基于最小化算法的区间,该区间试图根据的值最小化区间条件的长度。通常,这样的间隔不对应于测试。
这种现象与与未嵌套此类间隔有关的问题有关,这意味着94%的间隔可以比95%的间隔短。有关更多信息,请参阅我的最新论文的 2.5节(出现在Bernoulli中)。
在某些问题中,标准置信区间不是基于与标准检验相同的统计量(如Michael Fay在本文中所讨论的)。在这些情况下,置信区间和检验可能不会得出相同的结果。例如,即使置信区间中包含,可能会被测试拒绝。这与上面的“是”并不矛盾,因为使用了不同的统计信息。
正如f coppens在评论中指出的,有时间隔和测试的目标有些矛盾。我们需要较短的时间间隔和高功率测试,但是最短的时间间隔并不总是与最高功率的测试相对应。有关此示例,请参阅本文(多元正态分布)或此(指数分布),或论文的第4节。
几年前,我在这里发布了一个问题,关于贝叶斯统计中是否也存在检验间隔等价性。简短的答案是,使用标准贝叶斯假设检验,答案为“否”。通过稍微修改测试问题,答案可以是“是”。(我试图回答自己的问题的尝试最终变成了论文!)