您只需要问自己:“我怎么写原假设?”。考虑在组中某些行为(y / n)的频率的列联表。将第一组作为参考,您有比值比(),它们描述频率和组之间的关联。2×kkk−1θi,i=1,2,…,k−1
在具有同质性的独立性下,您假设所有的赔率比均为1。也就是说,对条件做出“是”的可能性与组分配无关。如果这些假设失败,则至少会有一组不同。
H0(homogeneity):∑k−1i=1|θi|=0
H0(independence):∑k−1i=1|θi|=0
并且可以使用观察/预期频率与Pearson卡方检验进行此检验,这是对Logistic回归模型的得分检验,其中对指标变量进行了组成员调整。因此,从结构上讲,我们可以说这些测试是相同的。k−1
但是,当我们考虑分组因子的性质时,会出现差异。从这个意义上说,测试的上下文应用或它的名称很重要。群体可能是结果的直接因果,例如基因的存在或缺乏或性状的等位基因模式,在这种情况下,当我们拒绝无效值时,我们得出结论,结果取决于所讨论的分组因素。
另一方面,当我们测试同质性时,我们无条件做出任何因果假设。因此,当“群体”是一个像种族这样的复杂结构时(它是由遗传,行为和社会经济决定因素引起的,并且由遗传,行为和社会经济决定因素引起),我们可以得出这样的结论,如“种族少数族裔经历住房差异,这由邻里剥夺指数的异质性所证明” 。如果有人反驳这样的说法,“那是因为少数族裔接受了较低的教育,获得了较低的收入并获得了更少的就业机会”,您可以说:“我并没有声称他们的种族是造成这些事情的原因,仅仅是因为您看起来在一场比赛中,您可以对他们的生活状况做出预测。”
这样,相关性测试是同质性测试的特例,其中潜伏因素的可能影响值得关注,应在分层分析中进行处理。在类似的Logistic回归模型中使用多元调整可以达到上述目的,并且我们仍然可以说我们正在进行依赖性测试,但不一定是同质性。