在 SPSS 中检查分类变量的相关性

数据挖掘 相关性 分类数据 spss
2022-02-28 07:26:16

我正在使用 SPSS 为分类问题构建预测模型。在自变量中,我有连续变量和分类变量。SPSS 仅给出连续变量之间的相关性。

SPSS中有没有办法找到相关性

a)两个分类变量
之间 b)分类变量和连续变量之间?

2个回答

为了测试分类变量之间的相关性,您可以使用:

  1. 二项式检验:单样本二项式检验允许我们检验两水平分类因变量的成功比例是否与假设值显着不同。例如,使用 hsb2 数据文件,假设我们希望测试女性(女性)的比例是否与 50%(即 0.5)显着不同。我们可以这样做,如下所示。

  2. 卡方检验:卡方拟合优度检验允许我们测试分类变量的观察比例是否与假设比例不同。例如,假设我们认为一般人口由 10% 的西班牙裔、10% 的亚裔、10% 的非裔美国人和 70% 的白人组成。我们想测试从我们的样本中观察到的比例是否与这些假设的比例有显着差异。

您可以从以下链接中找到进行上述分析的代码:

资料来源: http: //www.ats.ucla.edu/stat/spss/whatstat/whatstat.htm

我不确定比较数值变量和分类变量,但您可以做的一件事是将数值变量转换为类别。例如,如果是年龄,则可以将其转换为:[0,10), [10,20), ... , [90,100),这样就可以比较年龄与其他分类变量的相关性。

希望能帮助到你。

另一种方法是使用 SPSSINC HETCOR 扩展命令。它根据变量的测量水平计算一组 Pearson、多变量或多序列相关性。此扩展需要 Python 和 R Essentials。