我在SPSS中使用广义线性模型来研究16种不同植物上毛虫的平均数量差异(非正态,使用Tweedie分布)。
我想进行多个比较,但是不确定是否应该使用Sidak或Bonferroni校正测试。两种测试有什么区别?这个比那个好吗?
我在SPSS中使用广义线性模型来研究16种不同植物上毛虫的平均数量差异(非正态,使用Tweedie分布)。
我想进行多个比较,但是不确定是否应该使用Sidak或Bonferroni校正测试。两种测试有什么区别?这个比那个好吗?
Answers:
如果您使用作为您的显着性水平运行独立的统计检验,并且在每种情况下均获得null ,则是否会发现“显着性”仅仅是从随机变量中得出的。具体来说,它取自和的二项式分布。例如,如果您计划使用运行3个测试,并且(您不知道)每种情况实际上没有区别,那么在每个测试中有5%的机会找到有意义的结果。这样,I型错误率就保持为α p = α Ñ = ķ α = 0.05 α α α α ö α Ñ Ë 瓦特对于单独的测试,但是在3个测试的集合中,长期I型错误率会更高。如果您认为将这3个测试分组/组合在一起很有意义,那么您可能希望将整个集合而不是单个集合的I型错误率保持在。你应该怎么做?有两种方法可以将原始(即)转换为新值(即):
Bonferroni:调整用于评估“重要性” 的,以便
Dunn-Sidak:使用调整
(请注意,Dunn-Sidak假设该集合中的所有测试彼此独立,并且如果该假设不成立,可能会产生家庭式I型错误膨胀。)
即进行测试时,还有的是要注意重要的两种错误要避免,I型(即,说有是一个差异,当没有一个)和II型(即,说有不实际存在差异)。通常,当人们讨论此主题时,他们只会讨论-并且似乎只知道/关心-I类错误。另外,人们常常忽略了提到,只有当所有空值都为真时,计算的错误率才会成立。显而易见的是,如果原假设为假,就无法犯I型错误,但是在讨论此问题时明确记住这一事实很重要。
我之所以提出这一点,是因为这些事实的含义似乎经常被忽略。首先,如果,则Dunn-Sidak方法将提供更高的功率(尽管当较小时,差异可能很小),因此应始终首选(适用时)。其次,应该使用“逐步降低”方法。也就是说,先测试最大的效果;如果您确信在这种情况下不会获得null,则类型I错误的最大可能数目为,因此应相应地调整下一个测试,依此类推。(这通常会使人不舒服,看起来像钓鱼,但事实并非如此。ķ ķ - 1个α钓鱼,因为测试是独立的,因此您打算在看到数据之前进行测试。这只是最佳调整一种方法。)
无论您如何评价I型相对于II型错误,以上内容都适用。但是,先验没有理由相信类型I的错误比类型II的错误(尽管每个人似乎都假设这样)。相反,这是研究者必须做出的决定,并且必须针对特定情况。就个人而言,如果我运行理论上建议的先验正交对比,我通常不会调整。
(并且再次说明这一点,因为它很重要,以上所有假设均假设测试是独立的。如果对比不是独立的,例如将几种治疗方法与同一个对照进行比较,则不同于调整的方法,例如Dunnett的测试。)
用表示校正后的显着性水平,然后Bonferroni的工作方式如下:将显着性水平除以测试次数,即。Sidak的工作方式如下(如果测试是独立的): 。 α Ñ α * = α / Ñ α * = 1 - (1 - α )1 / Ñ
因为,所以Sidak校正功能更强大(即,您更容易获得明显的结果),但是Bonferroni的处理更简单。
如果您需要更强大的过程,则可能需要使用Bonferroni-Holm过程。
Sidak校正假设各个测试在统计上是独立的。Bonferroni校正不假定这一点。
Sidak和Bonferroni非常相似,因此无论使用哪种程序,您都可能得到相同的结果。Bonferroni比Sidak保守一点。例如,对于2个比较和0.05的家庭总alpha,Sidak将在.0253处进行每个测试,而Bonferroni将在.0250处进行每个测试。
该网站上的许多评论者都说Sidak仅在比较的测试统计数据独立时才有效。这不是真的。当测试统计数据为负相关时,Sidak允许略微增加家庭错误率,但是如果您正在进行双面测试,则通常不必担心负相关性。在非负依赖性下,Sidak实际上确实提供了全族错误率的上限。就是说,还有其他程序提供了这样的界限,并且比Sidak倾向于保留更多的统计能力。因此,Sidak可能不是最佳选择。
Bonferroni过程提供的一件事(Sidak没有提供)是严格控制预期的I型错误数-所谓的“每个家庭错误率”,它比家庭错误率更为保守。有关更多信息,请参阅:Frane,AV(2015)“每个家庭的I型错误率与社会科学和行为科学是否相关?” 现代应用统计方法杂志14(1),12-23。