独立性测试与同质性测试


10

我正在教授基础统计学课程,今天我将介绍两类独立性的卡方检验和同质性检验。这两种方案在概念上是不同的,但是可以使用相同的测试统计量和分布。在同质性测试中,其中一个类别的边际总数被认为是设计本身的一部分-它们代表为每个实验组选择的主题数。但是,由于卡方检验围绕所有边际总数的条件进行,因此,对同质性检验和具有分类数据的独立性检验进行区分不会有任何数学上的影响-使用该检验时至少没有。

我的问题如下:是否有任何流派的统计思想或统计方法会得出不同的分析结果,这取决于我们是在测试独立性(所有边际都是随机变量)还是在检验同质性(其中一组边际是由设计设置)?

在连续的情况下,假设我们在同一主题上观察并进行独立性检验,或者观察不同人群中的并检验它们是否来自同一分布,则方法是不同的(相关性分析与t检验)。如果分类数据来自离散连续变量怎么办?独立性和同质性的检验是否应该区分开?(X,Y)(X1,X2)


2
您能否提供区分“同质性测试”和“独立性测试”的来源?我曾经认为这是相同的(和Wikipedia也是如此)。也称为2向偶数表的卡方关联检验或与K无关的样本卡方比较检验。它应该与不糊涂单样本卡方检验也被称为卡方协议的测试。在其中,我们根据提供的理论预期频率测试了观察到的频率。
ttnphns

2
@ttnphns似乎很流行。我正在使用Raluca Balan和Gilles Lamothe的“期待意外”。去年,我在Sharpe,De Veaux等人的《商业统计》一书中任教。两种文本都充分区分了这一区别。在这两种情况下,我们都有一个2向列联表。不用说,这两个教科书都不认为应该为列联表分配一个影响大小:这是另一种情况,在基本统计课程中,微妙地胜过了有用性。
Placidia

2
如果您尝试获得效果大小的置信区间,则应该显示差异。
Ray Koopman 2013年

2
听起来很有趣。您介意添加一些细节并使其成为答案吗?
Placidia

4
这取决于您是否想通过区分有条件/无条件边际来折磨学生。如果不是,您可能只专注于解释“两个类别变量的独立性”等效于“条件分布的同质性”,然后提出单个 -test。(我通常将其与衡量联系强度的真实Cramer较低置信度限制一起提出。)χ2V
Michael M

Answers:


4

您只需要问自己:“我怎么写原假设?”。考虑在组中某些行为(y / n)的频率的列联表。将第一组作为参考,您有比值比(),它们描述频率和组之间的关联。2×kkk1θi,i=1,2,,k1

在具有同质性的独立性下,您假设所有的赔率比均为1。也就是说,对条件做出“是”的可能性与组分配无关。如果这些假设失败,则至少会有一组不同。

H0(homogeneity):i=1k1|θi|=0

H0(independence):i=1k1|θi|=0

并且可以使用观察/预期频率与Pearson卡方检验进行此检验,这是对Logistic回归模型的得分检验,其中对指标变量进行了组成员调整。因此,从结构上讲,我们可以说这些测试是相同的。k1

但是,当我们考虑分组因子的性质时,会出现差异。从这个意义上说,测试的上下文应用或它的名称很重要。群体可能是结果的直接因果,例如基因的存在或缺乏或性状的等位基因模式,在这种情况下,当我们拒绝无效值时,我们得出结论,结果取决于所讨论的分组因素。

另一方面,当我们测试同质性时,我们无条件做出任何因果假设。因此,当“群体”是一个像种族这样的复杂结构时(它是由遗传,行为和社会经济决定因素引起的,并且由遗传,行为和社会经济决定因素引起),我们可以得出这样的结论,如“种族少数族裔经历住房差异,这由邻里剥夺指数的异质性所证明” 。如果有人反驳这样的说法,“那是因为少数族裔接受了较低的教育,获得了较低的收入并获得了更少的就业机会”,您可以说:“我并没有声称他们的种族是造成这些事情的原因,仅仅是因为您看起来在一场比赛中,您可以对他们的生活状况做出预测。”

这样,相关性测试是同质性测试的特例,其中潜伏因素的可能影响值得关注,应在分层分析中进行处理。在类似的Logistic回归模型中使用多元调整可以达到上述目的,并且我们仍然可以说我们正在进行依赖性测试,但不一定是同质性。


3

如果以贝叶斯方法建模,则这两个问题之间存在明显的区别。在某些论文中,第一种情况(同质性)被称为“固定一个边距”的采样,第二种情况(独立性)被称为“固定总表”。例如,看看Casella等。(JASA 2009)
我正在研究这个主题,但是我的论文(也描述了这种区别)尚未发表:)


2
从常客主义的角度来看,也有明显的区别-只是渐近无关紧要,并且无论如何都经常提出以一个或两个边距为条件的争论。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.