这是一个好问题,但很大。我认为我无法提供完整的答案,但我会提供一些思考的机会。
首先,在最重要的要点下,您所指的校正称为连续性的Yates校正。的问题是,我们计算一个离散的推论统计:
(它是离散的,因为在列联表中仅表示有限数量的实例,该统计量可以具有有限数量的可能实现值。)尽管有这个事实,但仍将其与连续参考分布进行比较(即,该χ2分布与自由度([R-1)(ç-1))。这必然导致某种程度的不匹配。如果数据集特别小,并且如果某些单元格的期望值小于5,则p值可能会太小。叶兹的校正为此进行了调整。
χ2=∑(O−E)2E
χ2 (r−1)(c−1)
具有讽刺意味的是,相同的潜在问题(离散连续不匹配)可能导致p值过高。具体而言,通常将p值定义为获取极端或更大数据的概率比观察到的数据。对于连续数据,可以理解的是获得任何精确值的可能性都非常小,因此我们确实拥有更极端的数据可能性。但是,对于离散数据,获得与您一样的数据的可能性很小。仅计算获得比您的数据更极端的数据的概率会导致标称p值过低(导致I型错误增加),但包括获得与您的数据相同的概率会导致标称p值过高(这会导致II型错误增加)。这些事实促使人们想到了中间p值。在这种方法下,p值是数据比您的极端值加上一半的概率 数据的概率与您的相同。
如您所指出的,测试列联表数据有很多可能性。在这里,将对各种方法的优缺点进行最全面的讨论。该论文专门针对2x2表,但是您仍然可以通过阅读它来了解有关列联表数据的各种选择。
我也认为值得认真考虑模型。卡方检验等较早的测试快速,简便并且为许多人所理解,但并不能像建立适当模型那样全面地了解您的数据。如果可以将列联表的行[columns]视为响应变量,将列[rows]作为解释性变量/预测变量,则可以很容易地采用建模方法。例如,如果只有两行,则可以建立一个逻辑回归模型。如果有几列,则可以使用参考单元编码(虚拟编码)来构建ANOVA类型的模型。另一方面,如果您有两行以上,则多项式逻辑回归可以以相同的方式使用。如果您的行具有内在顺序,则序数逻辑回归将产生优于多项式的性能。对数线性模型(泊松回归)可能不太重要,除非我认为列联表的维度大于二维。
要对这些主题进行全面处理,最好的资料是Agresti的书:要么是他的全面论文(更严格),要么是入门书(更轻松,但仍然很全面并且非常好),或者也可能是他的序贯书。
更新: 仅出于可能测试列表的完整性考虑,我想到可以添加似然比测试(通常称为“G2-test
G2=∑O⋅ln(OE)