对于2 x 2列联表,某些Fisher精确测试使用表(1,1)单元格中的计数作为测试统计量,在零假设下,将具有超几何分布。
有人说它的测试统计量是 其中是null下超几何分布的平均值(如上所述)。它还说,p值是根据高计量分布的表格确定的。我想知道是否有一些原因减去均值然后取绝对值?在null下没有超几何分布,是吗?
对于2 x 2列联表,某些Fisher精确测试使用表(1,1)单元格中的计数作为测试统计量,在零假设下,将具有超几何分布。
有人说它的测试统计量是 其中是null下超几何分布的平均值(如上所述)。它还说,p值是根据高计量分布的表格确定的。我想知道是否有一些原因减去均值然后取绝对值?在null下没有超几何分布,是吗?
Answers:
(为使我们的概念更精确一点,我们称其为“检验统计量”,即我们查找以实际计算p值的事物的分布。这意味着对于两尾t检验,检验统计量应为 而不是 )
测试统计量的作用是在样本空间上诱导排序(或更严格地说,是部分排序),以便您可以识别极端情况(与备选方案最一致的情况)。
对于Fisher的精确测试,某种意义上已经存在排序-这是各种2x2表本身的概率。碰巧的是,它们对应于 在某种意义上说, 是“极端”的,也是概率最小的。因此,与其看待 按照您建议的方式,您可以简单地从大大小小的一端进行工作,在每一步中,只需添加任何值即可(最大或最小) -尚未存在的值)具有最小的关联概率,一直持续到到达观察表为止;如果将其包括在内,则所有这些极端表的总概率为p值。
这是一个例子:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
第一列是 值,第二列是概率,第三列是归纳排序。
因此,在Fisher精确检验的特定情况下,每个表格(等效于每个表格)的概率值)可以视为实际测试统计信息。
如果您比较建议的测试统计信息 ,在这种情况下,它会诱导相同的排序(我相信通常会这样做,但我没有检查),因为该统计量的较大值是概率的较小值,因此也可以视为“统计量” -但是其他许多数量也是如此-实际上,任何数量都可以保持这种顺序在所有情况下,s都是等效的测试统计信息,因为它们始终产生相同的p值。
还要注意,在开始时引入了更精确的“测试统计量”概念,因此该问题的所有可能的测试统计量实际上都没有超几何分布。 可以,但是实际上对于两尾测试来说,这不是一个合适的测试统计量(如果我们进行了单面测试,其中仅将主要对角线上的更多关联而不是第二对角线上的关联视为与替代一致,则可能是测试统计信息)。这与我刚开始时的一尾/二尾问题相同。
[编辑:某些程序确实提供了Fisher检验的检验统计信息;我认为这将是-2logL类型的计算,与卡方渐近可比。有些人可能还会提供赔率比或它的对数,但这并不完全相等。]
它实际上没有一个。测试统计信息是历史异常-我们拥有测试统计信息的唯一原因是获得p值。Fisher的精确检验跳过了检验统计量,直接达到了p值。