带重量的费舍尔精确检验?


12

有谁知道费舍尔精确检验的一种变化,它考虑了权重?例如采样权重
因此,代替通常的2x2交叉表,每个数据点都有一个权重该点的“质量”或“大小”值。

示例数据:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

然后,费舍尔精确测试使用此2x2交叉表:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

如果将权重作为数据点的“实际”数量,则结果将是:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

但这会导致信心过高。从N / Y更改为N / N的一个数据点将在统计上产生很大的差异。
另外,如果任何重量都包含分数,那将是行不通的。

Answers:


10

我怀疑“精确”测试和抽样权重本质上是不兼容的概念。我在Stata中进行了检查,该仓库具有用于抽样调查的良好设施,并且具有用于精确检验的合理设施,并且它针对带有样本权重的交叉表的8种可能的检验统计数据不包括任何“精确”检验,例如Fisher检验。

相关的Stata手册条目(对于svy:制表twoway)建议在所有情况下都使用其默认测试。此默认方法基于通常的Pearson卡方统计量。报价:

“为了说明调查设计,通过使用二阶Rao和Scott(1981,1984)校正,将统计量转换为具有非整数自由度的F统计量”。

参考:

  • Rao,JNK和AJ Scott。1981年。来自复杂样本调查的分类数据分析:卡方检验,用于确定两方表格中的拟合优度和独立性。美国统计协会杂志76:221–230。
  • Rao,JNK和AJ Scott。1984年。关于多向列联表的卡方检验,其中单元比例由调查数据估算得出。统计年鉴12:46-60。

3

有趣的问题。体重是什么意思?

我倾向于做一个引导程序...选择您喜欢的统计信息(即Fisher精确值),然后根据您的数据进行计算。然后根据您的零假设为每个实例分配新的像元,并重复该过程999次。在原假设下,这应该为您的测试统计量提供一个很好的经验分布,并且可以轻松计算p值!


谢谢!但我希望可以更快,更稳定地进行统计...
Michel de Ruiter 2010年

2

关于样本权重的一小件事-它们通常是合并一些有关样本来源的信息的方法-但通常它们基于“大样本”类型的情况(通常是伪装的BLUP或BLUE预测约束)。因此,我想样品权重可能总比没有权重好。我认为最好是直接使用样本设计所基于的总体信息。

R1,,RkkR1;11,R1;12,R1;21,R1;22,l=1kRl;ijRl;ijrl;iji,jRl;ij=Rl(l=1,,k)

P(Dm)=1P(Dm)=0如果它们不在样本中。但是,通常设计所基于的信息不只是一个人可能观察到的数据。但请注意,重要的是信息而不是调查设计本身。基于设计的推理只是将所有这些信息合并到您的分析中的一种非常有效的方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.