具有不同类别的有序变量的因子分析

机器算法验证 分类数据 spss 因子分析 序数数据 对应分析
2022-04-04 14:46:00

我有一个数据集,其中包含大约 40 个分类变量,这些变量被视为自变量(并且被认为与一些不可观察的人力资源因素有关)和 4 个分类变量(如公司的营业额、工作竞争等)。成为因变量。尽管变量具有不同数量的类别,但所有这些变量类别都可以排序。

我想看看这些因素实际上是如何影响因变量的。我知道如何对连续变量进行因子分析。我该如何处理这些具有不同类别的分类变量?

此外,还有另一个分类变量“大小”表示全职员工的数量(为 2,为 3),计划用作中介或调节变量。我想看看人力资源因素如何影响因变量。我的意思是,要发表类似“对于小公司(少于 25 名员工),人力资源因素 1 对盈利能力的影响相当大的评论,然而,在大中医院,话语权和盈利能力之间没有关系......bla bla bla “ (例如)252699>100

我如何将这些因素与分类因变量联系起来?我可以在 R 或 SPSS 中做任何你建议的事情吗?

2个回答

根据您对任务的描述,我觉得可以通过量化(将序数级别转换为规模级别)变量以最大化预测或关联的方式来解决。这被称为最佳缩放,并在 SPSS 中实现(当然,我相信在 R 中)。您可以在 3 个程序之间进行选择,均采用最佳缩放:

  • 分类 PCA(CATPCA 或 PRINCALS)。如果您需要 PCA 或因子分析,请使用此选项。该程序本身是 PCA,而不是暗示社区的狭义因素分析。如果您本身需要因子分析,您可以将 CATPCA 中获得的量化变量输入到标准因子分析程序中。确定了独立“资源”变量背后的组成部分或因素并获得了因素得分后,您可以通过序数回归(例如)检查它们对每个因变量的影响。
  • 分类典型相关分析(OVERALS)。使用它来绘制由独立和依赖变量集同时加载的潜在“特征”。如果您不熟悉规范相关,您可能想阅读一些有关规范相关的内容。
  • 分类回归(CATREG)。如果两组变量中的一组变量只包含一个变量,则这是 OVERALS。如果您想分别模拟自变量对每个因变量的影响,请使用它。它就像通常的线性回归一样,只是因为最优缩放它是非线性的。

一种应用于分类数据的 PCA 是 MCA(多重对应分析),可让您检测数据集中的底层结构。