也许最好解释一下Bonferroni之类的多项测试更正中的“原因”。如果这很清楚,那么您将能够判断自己是否应该应用它们。
在假设检验中,人们试图找到有关真实世界的某些已知或假定事实的证据。这类似于数学中的“通过矛盾证明”,即如果要证明例如参数为非零,则人们将假定相反的事实成立,即,人们将H 0:μ = 0假定为对。在这种假设下,人们试图找到一些不可能的东西。在统计中,事情很少是不可能的,但它们是非常不可能的。 μH0:μ=0
H1:μ≠0H0:μ=0α
H0H0
H0H0H1
虚假证据在科学上是一件坏事,因为我们相信已经获得了有关世界的真实知识,但实际上我们可能对样本不走运。因此,应控制此类错误。因此,应该对这种证据的概率设置一个上限,或者应该控制I型错误。这是通过预先确定可接受的显着性水平来完成的。
5%H05%H0H1H1
H0:μ1=0&μ2=0H1:μ1≠0|μ2≠0α=0.05
H(1)0:μ1=0H(1)0:μ1≠0H(2)1:μ2=0H(2)1:μ2≠0α=0.05
H(1)0H(1)0
1−(1−0.05)2=0.0975α
重要的事实是,这两个测试是基于一个和样本样本进行的!
注意,我们假设了独立性。如果不能假设独立性,那么可以使用Bonferroni inequality $证明I型错误最多可以膨胀0.1。
请注意,Bonferroni是保守的,并且Holm的逐步过程与Bonferroni的假设相同,但是Holm的过程具有更大的功能。
当变量是离散变量时,最好使用基于最小p值的测试统计信息,并且如果您准备在进行大量测试时放弃I类错误控制,则错误发现率过程可能会更强大。
编辑:
如果例如(请参见@Frank Harrell的答案中的示例)
H(1)0:μ1=0H(1)1:μ1≠0
H(2)0:μ1=0H(2)1:μ2≠0
H(12)0:μ1=0&μ2=0H(12)1:μ1≠0|μ2≠0 (i.e. the test that at least one of them has an effect) can be carried out by testing (on the same sample)
H(1)0 versus H(1)1 at the 2.5% level and also H(2)0 versus H(2)1 at the 2.5% level.