对问题1的回答:之所以发生这种情况,是因为当真实差异恰好等于0时,在频繁性差异检验(即无差异/某种形式相等的零假设的检验)中,随着样本量的增加,值会变得任意小,与任意套利接近于零相反,这是不现实的(请参阅尼克·斯汤纳对《任择议定书》的评论)。的 -值变得任意小,因为频率论检验统计量的误差通常与样品尺寸减小,与结果即所有差异都具有足够大的样本大小任意水平显著。莎玛兹(Cosma Shalizi)对此博学了。ppp
对问题2的回答:在常识性假设检验框架内,可以通过不仅仅推断出检测差异来预防这一情况。例如,可以将有关差异和对等的推论相结合,以使人们不赞成(或混淆!)效果证据的证据负担与不存在效果的证据的负担。没有效果的证据来自例如:
- 两个等效的单面测试(TOST),
- 一致最强大的试验等价,和
- 到等价的置信区间的方式(即,如果检验统计量%CI是内的先验当量/相关性-defined范围内,则一个在结束等价显着性水平)。α1−2αα
这些方法所共有的是关于什么效应大小构成相关差异的先验 决定,以及根据差异至少与被视为相关的差异构成的原假设。
差异检验和等价检验的组合推论因此可以防止您以这种方式在样本量较大时描述的偏差(两两表显示了由组合检验差异而产生的四种可能性-实证虚假假设H -和等价-否定原假设,H):− 0+0−0
请注意左上象限:压倒性测试是一种测试,是的,您拒绝无差异的零假设,但是您也拒绝相关差异的零假设,所以是的有差异,但是您有先验的决定不关心因为它太小了。
问题3的答案:请参阅答案2。