正如我们所知和另一个标称变量的类别之间的“焦点”关联由单元格中的频率残差表示。如果残差为 0,则表示频率是两个标称变量不相关时的预期频率。残差越大,由于样本中较大的负残差等效地表示代表性不足的组合。所以,频率残差就是你想要的。ijijij
但是,原始残差并不合适,因为它们取决于边际总计和总体总计以及表格大小:该值没有以任何方式标准化。但是 SPSS 可以显示标准化残差,也称为 Pearson 残差。St. 残差是残差除以其标准差的估计值(等于期望值的平方根)。表的 St. 残差具有均值 0 和 st。开发。1个;因此,圣。残差提供 z 值,就像定量变量分布中的 z 值一样(实际上,它是泊松分布中的 z)。St. 残差在相同大小和相同总的不同表之间具有可比性。列联表的卡方统计量是平方 st 的总和。残差N在里面。比较圣。表中和相同体积表中的残差有助于识别对卡方统计贡献最大的特定单元格。
SPSS 还显示调整后的残差(= 调整后的标准化残差)。调整。残差是残差除以其标准误差的估计值。有趣的形容词。残差正好等于,其中是总计,是对应于两个名义变量和的虚拟变量之间的 Pearson相关性(别名 Phi 相关性). 这正是你说你想要计算的。调整。残差与它直接相关。N−−√rijNrijijr
不像圣。剩余的,形容词 残差也被标准化为表格中边缘分布的形状(它不仅考虑了该单元格中的预期频率,还考虑了其行和列之外的单元格中的预期频率),因此您可以直接看到类别和之间的关系——不用担心它们的边际总数相对于其他类别是大是小。调整。残差也像 z 分数,但现在它像正态(不是泊松)分布的 z。如果形容词。残差高于 2 或低于 -2 您可能会得出结论,它在水平是显着的。调整。残差仍然受影响;ijp<0.051Nr不是,但您可以从 adj残差,遵循上述公式,无需花费时间生成虚拟变量。r2
关于你的第二个问题,关于三向类别关系 - 这可以作为一般对数线性分析的一部分,该分析也显示残差。然而,3 路单元残差的实际使用是适度的:3(+)路关联度量不容易标准化,也不容易解释。
1在圣。正态曲线是 2.5% 尾部的切点,因此如果您将两条尾部视为 2 边备择假设,则为 5%。1.96≈2
2因此,单元格中调整残差的显着性等于的显着性。此外,如果表中只有 2 列,并且您正在对和之间的比例进行 z 检验,行的列比例,该检验的 p 值等于两个(任何)adj 的显着性。行中的残差。ijrijPr(i,1)Pr(i,2)ii