类别之间的“焦点”关联 一世 一个名义变量和类别 Ĵ另一种是由频率表示残留在细胞我Ĵ, 据我们所知。如果残差为0,则表示频率是两个标称变量未关联时的预期频率。残差越大,由于组合的代表度过高,关联性就越大我Ĵ在样本中。大的负残差等效地表示组合不足。因此,剩余频率就是您想要的。
但是,原始残差不适合使用,因为它们取决于边际总数,总体总数和表大小:该值未以任何方式标准化。但是SPSS可以向您显示标准化残差,也称为Pearson残差。圣残差是残差除以其标准偏差的估计值(等于期望值的平方根)。表格的圣残差均值为0和圣。开发。1; 因此,圣。残差用作z值,类似于定量变量分布中的z值(实际上,它是泊松分布中的z)。在具有相同大小和相同总数的不同表之间,St。残差是可比较的ñ。列联表的卡方统计量是st的平方和。里面的残渣。比较圣。表中和同体积表中的残差有助于确定对卡方统计量贡献最大的特定像元。
SPSS还显示调整后的残差(=调整后的标准残差)。调整 残差是残差除以其标准误的估计值。有趣的 残差等于ñ--√[R我Ĵ,在哪里 ñ 是总计 [R我Ĵ是之间的皮尔逊相关性对应于类别的虚拟变量一世 和 Ĵ两个名义变量中的一个。这个[R正是您要计算的内容。调整 残差与之直接相关。
不像圣 剩余的 残余也被标准化为表格中边际分布的形状(不仅考虑了该单元格中的预期频率,而且还考虑了其行和列外的单元格中的预期频率),因此您可以直接看到强度的类别之间的联系一世 和 Ĵ- 不用担心他们的边际总数相对于其他类别而言是大还是小。调整 残差也像z得分,但现在它就像正态(不是泊松)分布的z。如果调整 残差高于2或低于-2,您可能会得出结论,该p<0.05
水平显着1个。调整 残差仍然受ñ; [R不是,但是您可以获得所有 [R来自adj。按照上面的公式计算残差,而无需花费时间来生成伪变量。2
关于第二个问题,关于三通类别关系-这可能是一般对数线性分析的一部分,该分析还显示残差。但是,三元细胞残差的实际应用是适度的:3(+)方式的关联度量不容易标准化,也不容易解释。
1个在圣 法线1.96 ≈ 2 是2.5%尾巴的切点,因此如果您将两根尾巴都视为2面替代假设,则为5%。
2 因此,调整后的单元格中残差的意义 我Ĵ 等于 [R我Ĵ。此外,如果表中只有2列,并且您要对之间的比例执行z检验Pr (i ,1 ) 和 Pr (i ,2 ),行的列比例 一世,则该测试的p值等于两个(任意)调整的意义。行中的残差一世 2列表格