多项卡方检验


11

我在2 x 2 x 6表格中交叉分类了数据。让我们叫的尺寸responseAB。我用模型对数据进行逻辑回归response ~ A * B。对该模型偏差的分析表明,术语及其相互作用都是重要的。

但是,从数据的比例来看,似乎只有2个左右的水平B对这些重要影响负责。我想测试一下是哪个级别的罪魁祸首。现在,我的方法是在的2 x 2表上执行6个卡方检验response ~ A,然后针对多个比较对这些检验的p值进行调整(使用Holm调整)。

我的问题是,对于这个问题是否有更好的方法。是否有更原则的建模方法或多重卡方检验比较方法?


我曾经在R邮件列表上问过同样的问题,但没有得到答复。我建议您更改标题,因为您的问题是关于“对卡方进行事后分析-以找出重要原因”(比我建议的标题短一些会更好:))
Tal Galili

只需查看您的罪魁祸首。...,然后使用泊松,对数线性模型。然后,您将获得与卡方检验所提供的相同的东西,但是您一次获得了所有不同的检验。
概率

Answers:


11

您应该查看“划分卡方”。这在逻辑上类似于在ANOVA中执行事后测试。它可以让您确定重要的整体测试是否主要归因于特定类别或类别组中的差异。

一个快速的Google展示了此演示文稿,最后讨论了对卡方进行分区的方法。

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


有趣。您是否遇到过R的实现?
塔尔·加利利

不,不是直接。但是,R将为您提供执行此操作所需的一切,例如:观察到的计数,期望值以及每个像元的残差。x <-matrix(c(12,5,7,7),ncol = 2)chisq.test(x)观察到的chisq.test(x)$残差expectedchisq.test(x)
Brett 2010年

我会给你打勾,因为这对我的研究生涯应该很有用。但是,此方法适用于ixj矩阵。但是,我的问题涉及一个ixjxk矩阵
JoFrhwld

2
卡方分区可扩展到多向列联表。这实际上是Agresti在他的书中引用的文章。HO Lancaster(1951)“用χ2分割处理复杂的列联表”皇家统计学会杂志。系列B(方法论),第一卷 13,No. 2
Brett

1

无原则的方法是丢弃不成比例的数据,重新拟合模型,并查看响应和A的对数/条件优势比是否存在很大差异(控制B)。这可能会告诉您是否值得关注。合并B的水平是另一种方法。在更原则的原则上,如果您担心引发Simpson悖论的相对比例,则可以查看响应/ A的条件和边际优势比,看看它们是否相反。

特别是为了避免进行多个比较,对我而言,唯一发生的事情是使用分层模型,该模型考虑了各个级别的随机影响。


0

我不确切知道您的目标是什么,或者为什么是目标。但是我通常不建议假设检验,而是建议将注意力集中在预测和置信区间上。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.